작성
·
336
1
GridAgent 스크립트 내
OnActionReceived 함수에서
처음에 무조건
AddReward(-0.01f); 해주는 정확한 이유를 알고 싶습니다.
답변 2
3
안녕하세요!
Agent가 Decision을 호출해서 action을 할 때 마다 패널티를 부여하여
결과적으로 에피소드를 빠르게 클리어하도록 유도하려는게 목적 입니다.
아래 코드(Agent.cs)를 보면 매 step마다 agent에게 보상을 부여하는것을 확인 할 수 있습니다.
저기서 m_Reward 값이 AddReward에 의해서 값이 변경 됩니다.
이렇게 반영된 m_Reward 값이 매 스텝마다 agent에게 전달되는 구조입니다.!
2