작성
·
212
·
수정됨
0
강사님 언제나 친절한 답변에 감사드립니다.
다름이 아니라 순환층의 가중치에 대해 질문이 있습니다
영상 강의에서는 가중치 Wh, Wx를 설명해주실 때 Wx는 샘플마다 동일하게 사용되고, Wh는 타임스텝마다 동일하게 사용된다고 말씀해 주셨습니다. 그런데 492p의 세번째 문단에서 '모든 타임스텝에 사용되는 가중치는 Wh 하나라는 점 입니다'라는 설명에서 혼선을 느끼고 있습니다. 이미지를 참고하였을 때는 결국 매 스텝마다 입력에 대한 Wx, 이전 은닉상태에 대한 Wh 모두 사용하는 것으로 이해가 생각이 되는데 어떤 차이점이 있어서 이렇게 설명해주신걸까요?
또 타임 스탭 1...3까지는 순환층 내부의 각각의 뉴런으로 이해되는데, 그렇다면 각각의 뉴런이 모두 동일한 Wx와 Wh를 가진다는 말씀이실까요? 아니면 Wx는 뉴런 별로 고유하되 Wh만 동일하다는 말씀이실까요? 493p에서 Wh의 개수가 9개라는 말이 Wh는 '하나의 값'이 아니라 각각의 뉴런이 다른 뉴런에게 전달한 각각의 값이기 때문에 각 뉴런에 3개씩 있다고 이해하는 것이 정확한지도 궁금합니다.
또 타임스텝의 순서는 임의의 순서대로 1,2,3 이렇게 정해지는 것인지 여러가지 방법이 있는지도 궁금합니다
답변 1
0
안녕하세요. 책의 문장이 조금 오해가 있을 수 있네요(책의 글은 제가 쓴 대로 똑같이 인쇄되지 않고 여러 편집 교정 과정을 거치거든요). 해당 문장을 다음처럼 조사를 옮겨 주세요. "모든 타임스텝에서 사용되는 가중치 Wh는 하나라는 점입니다"
492페이지 중간의 그림은 뉴런이 아니라 셀입니다. 셀 안에 여러 개의 뉴런(유닛)이 있고 당연히 뉴런마다 가중치는 다릅니다. 타임스텝의 순서는 모델에 데이터를 전달하는 과정에서 결정됩니다. 책에 1,2,3 이라고 쓴 것은 이해를 돕기 위함이며 번호는 아무런 의미가 없습니다.
감사합니다.