인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

내향적인 개발자 IDev님의 프로필 이미지

작성한 질문수

수학 없이 시작하는 인공지능 첫걸음: 기초부터 최신 트렌드까지

2강. AI의 대분류 - 데이터가 무엇인지를 판단하는 '판단 모델'

강화학습에 보상과 처벌이라고 한다면...

작성

·

22

0

 안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.

 

감사합니다.

답변

답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!