ML & DL
2020. 1. 19.
[강화학습] Lec.1 Introduction to Reinforcement learning
본 내용은 팡요랩의 강화학습 강의와 UCL Reinforcement learning Lecture 바탕으로 작성되었습니다. □ 강화학습이 기존 머신러닝(supervised)과 다른 점 - Supervisor가 없고, reward signal만 존재 : 사람이 정답을 주는 게 아닌 reward를 maximize 하는 방향으로 학습 - Feedback이 즉각적이지 않고 delay 될 수 있음 - 지도학습에서는 iid data 를 가정을 하지만, 강화학습은 sequential data이므로 시계열성이 중요 - Agent의 반응이 다음 data에 영향을 준다 > 강화학습의 활용 - 로봇, 게임, 투자..등등 □ Reward - scalar feedback signal, agent는 cumulative rewar..