묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결
Yolo를 이용한 객체 탐지 관련 질문
현재 Yolo를 이용해 물체의 LED를 찾아내는 학습을 진행중입니다.컴퓨터 비전 관련 연구 중에 Domain Randomization 관련 내용을 접하고, 이를 접목시키고자현실의 모델 대신 3D 모델을 만들어 모델의 이미지로 학습을 대신 진행해보았습니다.그런데 3D 모델로 학습 -> 현실의 모델 내 LED를 찾음 <<<< LED의 인식률이 너무 떨어져서 문제입니다.다양한 사진으로 학습해도 보통 공통점을 학습해서 탐지하는 것이 보통인데, 실제 현실 모델과 최대한 비슷하게 모델링해서 학습하는데도 왜 인식률이 처참한걸까요? 어느 부분을 고려해야 하는지 궁금합니다..
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection (mask_rcnn) 인퍼런스 관련 질문입니다.
안녕하세요. 좋은강의 잘 듣고 있습니다. 얼마전에 mmd-to-tensorrt 질문을 올렸었는데요. 사실 해당 라이브러리를 사용해보려 한 목적이 Inference의 속도를 향상시키려는 시도의 일환이었습니다. 혹시 mmdetection을 이용한 mask_rcnn 의 추론 속도를 향상시키는 다른 방안을 알고계신가 싶어 질문 드립니다. mmdetection에 포함된 다른 instance segmentation 검출 로직인 yolact를 사용하면 미세하게 속도의 향상이 있으나 검출 정확성 측면에서 mask rcnn이 더 낫더라구요. 항상 좋은 강의 감사드립니다.
-
미해결AI로 돈 버는 법 - 사례로 알아보는 AI Transformation
컴퓨터 비전과 딥러닝에 대해 질문드립니다.
컴퓨터 비전 문제 영역들은 꼭 딥러닝 기술이 아니더라도 구현가능한 것인가요? 답변부탁드립니다!!ㅠ
-
미해결
이미지,음성 딥러닝 공부 방법,순서 도와주세요
머신러닝쪽을 공부하고있는 학생입니다. 머신러닝쪽으로는 입상경력도 있고, 파이썬 문법에는 큰 어려움은 없습니다. 최근들어 자연어처리, 이미지처리쪽으로도 관심이 많이 생겨서 딥러닝을 공부도 하고 대회 입상도 준비하려는데 딥러닝에 경험이 많이 없는지라.. 모델뿐만아니라 전처리 방법 등을 어떻게 공부해야되고 독학으로 하려면 어떤 순서로 공부를 진행해야할지도 감이 안잡혀서 질문올렸습니다.. + 복학이 6개월 정도 남아서 6개월 정도만 잡고 독학으로는 힘들겠죠?
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
colab 실습 시 google drive mount 관련해서 질문드립니다.
강사님 안녕하세요~! '장시간 Training이 필요한 Colab 실습 진행시 유의사항' 강좌 8:18분 근방의 코드 관련해서 질문드립니다. Colab에서 장기간 Training을 위한 Google drive mount 를 위해서 !python train.py \ --training_data_path="/data/ICDAR2015/train_data/" \ --checkpoint_path="/content/drive/MyDrive/Colab Notebooks/인프런_컴퓨터비전_올인원/6강/east_resnet_50_rbox" 이렇게 코드를 안내해주셨는데요 ... 여기서 !python train.py\ 부분의 의미가 궁금합니다. 또 5강 실습 CRAFT를 이용한 License Plate Detection 모델 학습을 진행하기 위해서 Google drive mount를 적용해보려고 하는데.. 어떻게 코드를 작성해보면 좋을지 여쭤보고 싶습니다. 그럼 답변에 미리 감사드립니다..
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
AP, mAP의 차이점과 Ground Truth Bounding Box 질문입니다!
안녕하세요! 선생님, 예전 머신러닝 강의도 들어왔는데 이번 컴퓨터 비전 강의도 듣게 된 애청자 입니다! 다름이 아니라 질문이 있는데요! 1. AP와 mAP의 차이점에 대해 언급해주실 때 AP는 하나의 오브젝트에 대한 Precision 평균값이고 mAP는 여러 오브젝트에 대한 Precision 평균값들의 '평균값'이라고 설명해주셨는데요! 그렇다면 예를 들어 어떤 이미지에 자동차, 사람, 강아지 이렇게 3개의 오브젝트들이 있을 때 자동차에 대한 AP 따로, 사람에 대한 AP 따로, 강아지에 대한 AP 따로 계산을 하고 이 3가지를 평균값을 낸 걸로 이해하면 맞을까요? 2. 이전 강의에서 Bounding Box를 찾는 게 Regression 문제라고 하셨잖아요!? 그렇다면 어쨋거나 Ground Truth Bounding Box 좌표가 주어진 상태에서 뉴럴 넷이 Regression을 하는 지도학습이라고 볼 수 있는 거죠? 만약 지도학습이라고 한다면 각 이미지 마다 Ground Truth Bounding Box 좌표들은 사람이 직접 레이블링 해주어야 하는 건가요? 뉴럴넷이 알아서 Ground Truth Bounding Box를 찾아서 그 좌표로 수렴할 순 없지 않나요? 뉴럴넷이 찾은 Ground Truth 좌표가local minimum 인지 global minimum인지는 정확히 알 수 없으니까요..? 혹여나 제가 잘못알고 있는 지식이 있다면 지적은 환영입니다! 답변 기다리겠습니다~!