BEST
인공지능

/

딥러닝 · 머신러닝

프로그래머를 위한 강화학습(저자 직강)

비즈니스 혁신의 핵심 기술 강화학습에 관한 가장 쉽고 상세한 강의!!! 하루 2시간(2개 강의) 17일 안에 강화학습을 당신의 손안에 넣어드립니다. 지금 이 시간부터 강화학습은 이해하기 어려운 문제가 아닌 당신을 위한 훌륭한 도구가 됩니다.

(4.5) 수강평 29개

수강생 434명

Thumbnail

초급자를 위해 준비한
[데이터 분석, 딥러닝 · 머신러닝] 강의입니다.

이런 걸
배워요!

  • 강화학습 기초 이론(수학, 통계, MDP)

  • 인공신경망 개념(신형회귀, 분류분석, 인공신경망)

  • 강화학습 알고리즘(DQN, REINFORCE, A2C, PPO)

  • 강화학습 알고리즘 튜닝(그리드서치, 베이지안 최적화)

  • 인공신경망 튜닝(최적화, 활성화함수, 전처리)

미래 비즈니스의 핵심 기술 '강화학습'
기본 개념부터 쉽고 자세하게 알려드립니다. 🦾

■ 과정 개요

본 강의는 프로그래머를 위한 강화학습 도서를 중심으로 만들어졌습니다. 지면에 모두 담을 수 없었던 내용을 저자가 직접 강의해 드립니다. 하루에 2시간씩 17이면 강화학습을 나만의 기술로 만들 수 있습니다. 지금 이 순간부터 강화학습은 어렵고 이해할 수 없는 넘사벽이 아닌 자유롭게 활용해서 나의 가치를 높여주는 아주 훌륭한 도구가 될 것입니다.

강의에 사용된 예제는 https://github.com/multicore-it/rl 사이트에서 다운로드 받을 수 있습니다.

blankblankblankblankblankblank

왜 강화학습인가?

강화학습은 자본이 아닌 실력 중심

강화학습은 미리 라벨링된 데이터를 학습하는 것이 아니라 에이전트를 실행하면서 데이터를 스스로 만들어 내기 때문에 데이터 작업에 대한 부담이 적고, 컴퓨팅 파워가 상대적으로 적게 듭니다. 강화학습 알고리즘에 대한 깊은 이해와 문제를 해결하기 위한 프로그래밍 실력에 많은 것이 달려있기 때문에 실격으로 승부할 수 있는 분야입니다.

강화학습은 미래 비즈니스 혁신의 핵심 기술

강화학습은 대한민국과 같이 자본력이 부족한 환경에서 적합한 인공지능 기술입니다. 비즈니스 환경에서 발생하는 많은 문제들을 프로그래밍 실력과 강화학습 알고리즘으로 해결할 수 있고, 이러한 특성을 기반으로 보다 향상된 서비스와 제품을 만들어 낼 수 있기 때문입니다.

강의 특징

학습 내용

강화학습 기초개념 부분에서는 강화학습에 필요한 통계 및 수학 이론을 먼저 설명한 다음, MDP에서 DQN 알고리즘에 이르는 과정을 자세하게 설명합니다.

인공신경망 부분에서는 인공신경망에 대해 중점적으로 설명하기 보다는 인공신경망으로 이르는 과정을 선형회귀부터 차근차근 설명합니다. 인공지능에 대한 개념이 전혀 없는 사람도 이해할 수 있도록 기초부터 설명하기 때문에 프로그래밍에 대한 약간의 지식만 있으면 어느 누구도 쉽게 이해할 수 있습니다.

가치기반 강화학습 부분에서는 DQN 알고리즘을 코드 중심으로 설명합니다. 다양한 강화학습 알고리즘 중 가치기반 강화학습이 상대적으로 이해하기 쉽기 때문에 먼저 소개합니다.

정책기반 강화학습 부분에서는 REINFORCE, A2C, PPO 알고리즘을 코드를 중심으로 설명하고 직접 실행할 수 있도록 안내합니다. 정책기반 알고리즘은 가치기반 알고리즘 보다 이해가 어렵지만 비교적 안정적인 성능을 보여주기 때문에 많은 시간을 할애해서 설명하고 있습니다.

마지막으로 강화학습 튜닝을 설명합니다. 튜닝에 필수적인 인공신경망 세부 이론부터 시작해서 알고리즘 파라미터 튜닝을 효율적으로 돕는 베이지안 최적화 기법까지 구체적으로 다루고 있습니다.

■ 프로그램 오류조치

새소식 "프로그램 오류 조치 안내(2022년 12월 10일)" 참고하세요

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 인공지능으로 업무를 개선하고 싶으신 분

  • 나를 도와줄 지능화된 소프트웨어 봇을 만들고 싶으신 분

  • 인공지능 기술을 활용해서 혁신적 제품을 만들고자 하는 분

선수 지식,
필요할까요?

  • 프로그래밍(Java, C 등) 경험과 약간의 파이썬 문법

안녕하세요
멀티코어입니다.

멀티코어(multicore.it@gmail.com)는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.

커리큘럼

전체

35개 ∙ (6시간 48분)

수업 자료

가 제공되는 강의입니다.

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!