작성
·
279
0
강의 잘 듣고 있습니다.
지금 CIFAR 데이터셋 CNN구현 실습 부분을 보고 있으면서 궁금한점 이 생겨 문의드립니다.
학습시 Conv2D, Activation, Maxpooling2D 같은 필터 개수는 어떻게 정의하는건가요 ?
param이 어떻게 변하는지는 설명을 잘 해주셔서 이해했는데,
Conv2D 등을 통해 필터시 어떤 기준으로 여러번 사용하는지가 이해가 안되내요.
감사합니다.
답변 1
1
안녕하십니까,
좋은 질문 이군요.
아마 본 강의를 계속 들으시면 더 자세히 아시겠지만, 이 Conv2D, Activation, MaxPooling 적용하여 CNN 모델을 만들 시 어떤 기준으로, 어떤 파라미터를, 어떻게 적용하는지가 바로 CNN모델의 발전 방향입니다. CNN 모델 선구자들이 말씀하신 고민사항들을 특정 이론이나 경험적/실험적 결과에 따라서 모델을 발전 시켜 왔습니다.
섹션 9와 10인 Advanced CNN 모델 파헤치기를 보시면 이러한 CNN 모델의 발전 사항을 제가 자세히 설명을 드리고 있습니다. 그리고 CNN 모델 성능에 영향을 미치는 것은 비단 Conv 레이어 외에도 다양한 요소들이 있습니다.
현재 듣고 계시는 섹션 5. CNN 모델 구현 및 성능 향상 기본 기법 적용하기 에서 이런 내용들을 설명드립니다. 또한 CNN 모델외에도 학습 데이터의 image augmentation 기법 역시 중요한 성능 향상 요건이 되기에 이어지는 섹션에서 설명 드리고 있습니다.
요약드리자면, Conv2D, Activation, Maxpooling2D 같은 필터 개수는 어떻게 정의하는지의 기준은 없습니다. 중요한 것은 시대를 선도한 CNN 모델들은 자신들만의 여러가지 다양한 CNN 구성요소, 예를 들어 Conv2D, Activation, Maxpooling2D외에도 Batch Normalization, 가중치 초기화, 1x1 conv, residual block, learning rate 동적 변경등의 다양한 요소들을 적용하여 성능을 개선해 왔습니다.
앞으로의 강의에서 해당 부분들을 보다 자세하게 배우실 것입니다.
감사합니다.