강화학습 논문 읽기
학습 대상은
누구일까요?
강화학습을 처음 접하는 사람
선수 지식,
필요할까요?
미분
전체
10개 ∙ (13시간 2분)
1. 강화학습 introduction
01:20:23
2. Markov Decision Process
01:15:36
4. Model Free Prediction
01:16:37
5. Model Free Control
01:06:22
6. Value Function Approximation
01:19:54
7. Policy Gradient
01:33:38
9. Exploration and Exploitation
01:13:10
10. Classic Games
01:15:22
무료