이런 걸
배워요!
강화학습 기초 이론
Tensorflow 2.0 강화학습 프로그래밍
강화학습이란 쉽게 말해 컴퓨터 프로그램이 주어진 상황에서 어떠한 행동을 취할지 학습하는 것을 의미합니다. 즉 어려운 의사결정 문제를 쉽게 해결할 수 있는 일종의 머신러닝이라고 이해하면 좋을 것 같아요. 강화학습은 인공지능이 의사결정을 하는 데 있어 가장 필수적인 내용 중 하나로, 스스로 기계가 상호작용을 통해 최적의 결론을 낼 수 있는 프로그램을 설계할 수 있게 될 것입니다.
강화학습을 공부하고 싶은 우리의 바람과 다르게, 강화학습을 혼자 공부하는 것은 너무 어렵습니다. 가장 큰 두 가지 이유를 꼽아보면요.
강화학습을 공부하신다면 최신 논문과 현란한 데모들을 꿈꾸실 수 있지만, 좀 더 먼 미래를 위해서는 강화학습의 기본기를 충실히 익힐 필요가 있습니다. 이 강의를 통해 여러분은 강화학습의 기초 개념을 심도 있게 배우고 다음과 같은 모습으로 거듭나실 수 있을 것입니다.
이 강의를 들은 후 당신의 모습!
강화학습의 기초 이론과 프레임워크에 대해 알아보고, 인공지능의 보상 체계와 관련된 기초 개념인 멀티 암드 밴디트와 마르코프 상태, 보상, 상태 전이 등에 대해 알아봅니다.
앞서 배운 마르코프 결정 프로세스의 내용을 기반으로 동적 프로그래밍의 정의와 활용 방법에 대해 알려드립니다.
계산하려고 하는 값이 복잡한 경우 사용하는 몬테카를로 방법의 기초 개념에 대해 알아봅니다.
실제 학습의 경험으로부터 직접 배우는 형태의 시간차 학습의 기초 개념을 알아보고, 몬테카를로 방법과 직접 비교하며 어떤 상황에서 활용할 수 있을지 알아봅니다.
머신러닝에서의 모델의 개념을 알아보고, 표와 모델에 기반한 강화학습 이론을 알아보고 직접 실습해 봅니다.
가치함수를 토대로 행동을 결정하지 않고, 상태에 따라 바로 행동을 선택하는 정책 기반 강화학습에 대해 알아봅니다.
현) Riiid VP of AIOps
현) Google Developer Expert for ML
전) 네이버 AI Research Engineer
전) 카카오 Data Engineer
Q. 비전공자, 입문자도 들을 수 있는 강의인가요?
네 그렇습니다. 기초 개념을 다루기 때문에 전공자가 아닌 분들도 명확하게 이해할 수 있도록 차근차근 알려드릴 예정입니다.
Q. 왜 강화학습을 배워야 하나요?
저는 인공지능의 미래가 강화학습에 달려 있다고 믿습니다. 특히 AI Production과 강화학습을 커리어의 두 키워드로 삼았을 만큼 강화학습에 대한 확신이 있습니다.
Q. 강화학습을 배우면 뭐가 좋은가요?
인공지능이 주어진 상황에서 의사결정을 내리는 방법에 대한 이론적 토대를 쌓을 수 있게 됩니다.
Q. 강의를 듣기 전, 준비해야 할 것이 있나요?
Python의 기초를 조금 익혀두시면 강의 수강에 도움이 될 겁니다.
Q. 수업 내용을 어느 수준까지 다루나요?
기초 이론과 간단한 실습까지 다루게 될 것입니다.
학습 대상은
누구일까요?
강화학습의 기본기를 익히고 싶은 분들
알파고의 원리를 이해하고 싶은 분들
머신러닝 대학원에 진학 예정인 분들
머신러닝으로 커리어를 전향하고자 하는 분들
선수 지식,
필요할까요?
파이썬 기초
수강생 수
1,000
수강평 수
86
강의 평점
4.4
강의 수
3
(현) 뤼이드 VP of AIOps
(현) Google Developer Expert for Machine Learning
(전) Naver - AI Research Engineer
(전) Kakao - Data Engineer
전체
12개 ∙ (5시간 2분)