작성한 질문수
수학 없이 시작하는 인공지능 첫걸음: 기초부터 최신 트렌드까지
2강. AI의 대분류 - 데이터가 무엇인지를 판단하는 '판단 모델'
2025. 03. 17. 07:17 작성
·
22
0
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.
감사합니다.
답변