인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

이효빈님의 프로필 이미지
이효빈

작성한 질문수

만들면서 배우는 인공지능(강화학습 편)

강화학습 방법

alpha가 학습속도를 조절하는 상수라고 하셨는데

작성

·

237

0

그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?

999999이런 식으로 하면 좋은 것인가요??

숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요? 

만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요? 

아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요? 

만약 패널티가 생긴다면 어떤 패널티가 생길까요>??

감사합니다.

답변 2

0

이효빈님의 프로필 이미지
이효빈
질문자

감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??

감사합니다! 

0

최광성님의 프로필 이미지
최광성
지식공유자

결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.

알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.

감사합니다.

이효빈님의 프로필 이미지
이효빈

작성한 질문수

질문하기