이런 걸
배워요!
강화학습 논문 읽기
학습 대상은
누구일까요?
강화학습을 처음 접하는 사람
선수 지식,
필요할까요?
미분
전체
10개 ∙ (13시간 2분)
강화학습 introduction
01:20:23
Markov Decision Process
01:15:36
Planning by Dynamic Programming
01:19:49
Model Free Prediction
01:16:37
Model Free Control
01:06:22
Value Function Approximation
01:19:54
Policy Gradient
01:33:38
Exploration and Exploitation
01:13:10
Classic Games
01:15:22