본 강좌는 강화학습을 수학 없이 설명합니다. 개념을 쉽고 분명하게 배울 수 있습니다. 뿐만 아니라. 언어 중 제일 접근하기 쉬운 파이썬으로 작성해 놓은 RLkit 를 직접 코딩하면서 실제 틱택톡 게임을 구현하고 실행할 수 있습니다.
이런 걸
배워요!
강화학습의 기본 개념
마코프 결정 과정
Python을 이용한 강화학습 구현
RLkit 프레임워크 사용법
틱택토 게임을 통한 실습
이세돌과 대국했던 딥만이드의 알파고는 강화학습이란 머신러닝 테크닉으로 훈련됐습니다. 강화학습은 머신을 훈련할 때 가장 좋은 대안으로 평가됩니다. 본 강좌는 강화학습을 수학 없이 설명합니다. 개념을 쉽고 분명하게 배울 수 있습니다. 뿐만 아니라. 언어 중 제일 접근하기 쉬운 파이썬으로 작성해 놓은 RLkit 를 직접 코딩하면서 실제 틱택톡 게임을 구현하고 실행할 수 있습니다.
기계학습(머신러닝)의 한 영역으로, 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 순서를 선택하는 방법이다.
최광성
대학원 때 부터 프로그래밍에 빠저 살았습니다. 졸업 후 실험실에 남아 반도체 공장 예측 시뮬레이션 소프트웨어 개발에 참여했습니다. 주력 언어는 C++과 CUDA입니다. CCG라는 스타트업에서 CTO를 맡았습니다. SIMPLE이라는 GPU용 인터프리터 언어를 개발했습니다. https://github.com/cks3443/simple
학습 대상은
누구일까요?
인공지능에 관심 있는 사람
강화학습을 배우고 싶은 초보자
Python 프로그래밍에 익숙한 사람
실습을 통해 배우고 싶은 사람
게임 개발에 관심 있는 사람
전체
16개 ∙ (58분)
가 제공되는 강의입니다.
소개
03:00
환경
02:00
스테이트, 에이전트, 리워드
02:00
마르코프 결정 과정 1
02:00
마르코프 결정 과정 2
03:00
리워드 결정 방법
03:00
강화학습 방법
04:00
학습된 머신이 플레이하는 방법
01:00
환경설치
06:00