작성
·
194
1
안녕하세요 맛비님
강의 수강중 궁금한점이 생겨 질문드립니다
CNN의 구조에서 이미지의 특징을 추출하는 부분이 있고,
추출한 feature map->fully connected layer를 통해 분류하는 부분이 있고, ..
이런 과정으로 이해했는데요
하나의 NPU안에 fully connected layer, ReLU 등 모든 CNN의 모든 layer가 포함되어 있는건지, 아니면 NPU는 output feature map만 연산하고 그것에 대한 분류는 소프트웨어를 사용하는지 잘 모르겠습니다
=================
현업자인지라 업무때문에 답변이 늦을 수 있습니다. (길어도 만 3일 안에는 꼭 답변드리려고 노력중입니다 ㅠㅠ)
강의에서 다룬 내용들의 질문들을 부탁드립니다!! (설치과정, 강의내용을 듣고 이해가 안되었던 부분들, 강의의 오류 등등)
이런 질문은 부담스러워요.. (답변거부해도 양해 부탁드려요)
개인 과제, 강의에서 다루지 않은 내용들의 궁금증 해소, 영상과 다른 접근방법 후 디버깅 요청, 고민 상담 등..
글쓰기 에티튜드를 지켜주세요 (저 포함, 다른 수강생 분들이 함께보는 공간입니다.)
서로 예의를 지키며 존중하는 문화를 만들어가요.
질문글을 보고 내용을 이해할 수 있도록 남겨주시면 답변에 큰 도움이 될 것 같아요. (상세히 작성하면 더 좋아요! )
먼저 유사한 질문이 있었는지 검색해보세요.
잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
==================
답변 1
0
안녕하세요 🙂
NPU 마다 다르겠지만, MAC 연산과 같은 곱하고 더하는 로직들은 share 해서 사용하고요.
MAC 연산을 할 수 있는 Array 가 존재하고, recursive 하게 사용합니다.
어떤 NPU 는 각 Part 별로 로직이 존재하는 것들도 있습니다.
따라서 질문주신 내용은 추상적이긴 한데, SW (NPU 외) 개입을 최소화 해야 PPA 관점에서 효율적이기 때문에 대부분 HW 가 처리하신다고 생각하시면 될 것 같아요.
즐공하세요 🙂
"모델마다 레이어의 구조라던지 연산방법이라던지.. 이런게 다 달라서 다른 회로가 필요할거같은데"
네, 정확하게 동의합니다.
하나의 칩(팹리스라면 판매하는 IP단위?)당 하나의 딥러닝 모델만을 지원하는건가요?
모델의 발전속도가 매우 빠르기 때문에, 하나의 모델만 지원하는건 npu 를 판매하는 입장에서 좋은 선택지는 아닌 것 같아요. FPGA 처럼 programable 하다면, 특정 모델을 지원하는 bit file 을 여러개 만들면 되겠지만, ASIC 은 한번 만들면 HW 수정이 불가능하죠.
회사마다 지원방식이 매우 다르지만, 보통 여러모델을 지원할 수 있도록 npu 를 설계 합니다.
넵 감사합니다
또 추가적인 질문이 있는데요
강의중에 어떤 npu는 어떤 모델에 적합하고, 또 다른 npu는 다른 모델에 적합하고... 다 다르다 이런 내용이 있었던거같은데
모델마다 레이어의 구조라던지 연산방법이라던지.. 이런게 다 달라서 다른 회로가 필요할거같은데
하나의 칩(팹리스라면 판매하는 IP단위?)당 하나의 딥러닝 모델만을 지원하는건가요?