인프런 커뮤니티 질문&답변

bs Jeon님의 프로필 이미지
bs Jeon

작성한 질문수

프로그래머를 위한 강화학습(저자 직강)

REINFORCE 알고리즘 프로그래밍

MyModel(tf.keras.Model)에 action matrix와 reward와 관련해서

작성

·

202

0

training시에 필요한 action matrix와 reward를 받기위해 inputs에 dummy로 input_action_matrixs와 input_rewards를 정의하고 있는것처럼 보이는데요.

 

이렇게 하지않고 MyModel에 예를들면 setActionMatrixs, setRewards 이런식으로 함수를 정의하고 fit를 호출하기전에 set함수를 호출하여도 될것 같은데, 이렇게 했을때 단점이 있나요?

답변 1

0

멀티코어님의 프로필 이미지
멀티코어
지식공유자

안녕하세요 bs Jeon님

강의를 수강 해 주셔서 감사합니다.

말씀하신 것처럼

self.DUMMY_ACTION_MATRIX, self.DUMMY_REWARD = np.zeros((1,1,self.action_size)), 
                                              np.zeros((1,1,self.value_size))

위 코드는 변수 초기화를 위해서 사용하는 것입니다.

위와 같은 방식으로 사용하면 클래스가 생성되는 시점에 변수가 자동으로 초기화됩니다.

또한, bs Jeon님 의견과 같이 변수 초기화를 담당하는 set 함수를 정의해서 객체를 생성하는 시점에 set 함수를 호출해서 초기화할 수도 있습니다. 성능 상의 차이는 없고 단지 코드 구현 상의 차이입니다. 본인의 코딩 스타일에 맞게 사용하시면 됩니다.

감사합니다.

 

bs Jeon님의 프로필 이미지
bs Jeon

작성한 질문수

질문하기