작성한 질문수
만들면서 배우는 인공지능(강화학습 편)
강화학습 방법
작성
·
237
0
그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?
999999이런 식으로 하면 좋은 것인가요??
숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요?
만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요?
아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요?
만약 패널티가 생긴다면 어떤 패널티가 생길까요>??
감사합니다.
답변 2
감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??
감사합니다!
결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.
알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.