묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨최신 딥러닝 기술과 객체인식
yolo anchor box 질문
안녕하세요 질문있어서 남깁니다.input 이미지를 backbone을 거치고 정보가 함축된 이미지 feature map을 만든 후 cell별 anchor box를 통해 Detection을 진행하는걸로 이해했는데요,실제 이미지는 feature map과 스케일이 다를텐데, 그러면 최종 결과 이미지에서는 이 값(x,y,w,h)을 보정한 최적 bounding box 값을 출력하는 건가요?
-
해결됨최신 딥러닝 기술과 객체인식
yolov4 bifpn
안녕하세요 yolov4 bifpn에서 input과 다른 여러 scale의 이미지를 합치는데 resize해서 concat하는 건가요 아니면 그냥 element sumwise하는건가요?!
-
해결됨최신 딥러닝 기술과 객체인식
YOLOv1(2) 모델 + GoogLeNet~~ 관련 질문
강의 잘 듣고 있습니다.해당 강좌에서 1:50쯤에 나오는 모델의 구성을 보면 마지막 단에 7x7x1024의 Feature map을 Flatten한 뒤 Linear layer를 거친 후 다시 7x7x30으로 변환되는 것으로 보이네요.조금 찾아보니 1,470을 출력으로하는 Linear layer를 거친 후 다시 7x7x30으로 재구성하더군요.헷갈리는 점은 Flatten과 Linear layer과정에서 공간적인 정보가 소실된 것 같은데 이를 7x7x30으로 바꾸어도 괜찮은가요? Feturemap[0][0]에 있는 30의 특징값은 앞에서 해석한 것과 같이 원본 이미지의 (1,1) Cell에 있는 30개의 특징값과 동일하다고 생각하면 될까요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
colab과 github의 연동
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.안녕하세요 교수님강의 잘 듣고 있습니다.colab의 github 사본 저장을 통해 github에 코드를 저장해두었는데 코드를 옮기게 되면 Invalid syntax라고 뜹니다.구글링을 해보아도, 도무지 해답이 나오지 않아 colab에서 코드를 다운로드하고, github에 그냥 업로드를 시켰습니다.강의와 다른 질문이지만, 해결해주시면 감사하겠습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetction 학습 후 성능지표 그래프
안녕하세요. 자꾸 질문드려 죄송합니다.mmdetection mask R-CNN 학습 후 validation 데이터에 대한 성능지표 그래프를 보고 싶은데요. 학습데이터와 검증데이터로 나누어, 학습을 약 10시간 이상 수행하였는데, 성능지표 그래프가 나오지 않아서요.YOLO 같은 경우는 학습시킨 후, ultra_workdir 디렉토리에, cofusion_matrix.png, f1_curve.png, PR_curve.png와 같은 파일들이 생기고, 배치 이미지에 대한 식별 및 분류사진이 있었는데, mmdetection에서도 이와 같은 성능지표 그래프를 볼 수가 있는지 궁금합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask rcnn에서 mmdetection의 배치사이즈 설정
안녕하세요. 교수님 강의 잘듣고 있습니다.Mask rcnn의 수업과정의'Balloon 데이터를 이용한 Train 실습 - Train 실행 및 Gray Scale로 배경 적용한 Segmentation 구현하기'를 참고해서,제가 가지고 있는 이미지 데이터에 학습을 시켜보고 있습니다.MMDetection은 배치사이즈를 어디서 설정하는지 궁금합니다. config 파일을 보면, 'mask_rcnn_r50_fpn.py'은 mmdetection/configs/base/models에 위치해 있는데,배치사이즈로 볼만한 내용이,다음 내용밖에는 없거든요.cfg.auto_scale_lr = dict(enable=False, base_batch_size=62)16을 62로 변경했는데, Epoch의 배치사이즈는 변하지 않고 그대로 10으로 설정되는것 같습니다.Mask Rcnn은 배치사이즈를 어디서 설정하는지 궁금합니다.
-
해결됨최신 딥러닝 기술 Vision Transformer 개념부터 Pytorch 구현까지
행렬 차원 수 질문
안녕하세요.'비전 트랜스포머-최신 모델' 강의 11:36 근처 슬라이드를 기준으로 질문드리겠습니다. (사실 그 이후부터 계속 지속적으로 차원 혼동이 있는 것 같아서, 하나를 기준삼아서 질문드리면 나머지가 저절로 해결될 것 같습니다.) p=(size of patch)로 정의를 하고 사진을 N개로 쪼갠다고 가정했을 때, 그것을 flatten시켜준 각각의 벡터들, (x_{p}^{i}, i=1,...,N)이라고 가정했을 때, 해당 벡터는 P^2*C 차원의 벡터들이 되는 거잖아요? 그렇다면, 그 N개의 벡터들을 concatenate하여 행렬 x_p를 구축했을 때, 그 차원은 (P^2*C) by N이 되어야 하는게 아닌가요? 이 이후부터 슬라이드에서는 가로와 세로가 뒤바뀌어 있는 것 같은데 뭐 실전에서는 transpose하면 되는 문제긴 하지만 나름대로 엄청나게 궁금해져서 질문을 드려봅니다. 설명을 해주신거나 그림을 그려주시는 것은 모두 x_{p}^{i}가 열벡터이고 concatenate를 하실 때 row-wise가 아니라 column-wise로 합치신 것 같아서 그렇게 생각이 들었습니다.
-
미해결최신 딥러닝 기술과 객체인식
평가 지표 실습(4) IoU와 mAP 질문
1분 쯤에 나오는 표에서 conf는 임계치가 아닌 confidence score를 나타냅니다. 그런데 강의 내용과 오른쪽 P-R curve는 conf를 임계치로 생각하고 말씀을 해주시는데, 제가 헷갈린건지 아니면 오류가 있는건지 알려주실 수 있으실까요? 😀 또 헷갈리는게 있는데, 만약 AP를 계산할 때 IoU 임계값에 따른다고 하면 confidence 임계 값은 고정을 하고 계산하는거겠죠? 그렇다면 논문 마다 mAP를 계산하는 방식이 다른데 이는 논문에서 계산방법을 보통 알려주나요?
-
해결됨최신 딥러닝 기술과 객체인식
평가 지표 실습 (3) PR curve와 mAP 질문
안녕하세요!강의에서 Precision-Recall를 구할 때 Confidence score를 기준으로 내리차순 한 뒤 P, R을 구하는 방법을 알려주셨습니다. 근데 실제 구현에서는 바로 tp,fp,tn,fn 을 구한 뒤 P,R을 구하는게 훨씬 빠를 것 같은데 해당 방식은 왜 나온건가요? 사람이 직접 구할 때 조금 더 직관적으로 보기 위해서 사용하는 방식인가요?
-
해결됨최신 딥러닝 기술 Vision Transformer 개념부터 Pytorch 구현까지
Self Attention 질문 있습니다.
1.q와 k를 내적 하는 이유가 궁금합니다. 이는 입력의 유사도 행렬을 얻기 위함으로 알고 있습니다. 그렇다면 q와 k가 아닌 q와 q의 트랜스포즈로 내적하면 안되는걸까요?음 ...업데이트 할때 q와 k가 비슷하게 학습되었다는 가정을 가지고 내적 한걸까요?2.그리고 Multi Head와 그냥 Self attention의 차이가 궁금합니다.별도의 파라미터로 학습되기때문에 하나일때보다 많은 관점이 녹아있다고 생각하면 될까요?3.다른 댓글에서 코드A@V가 리니어 라고 하셨는데요PPT에서는 SA(z)=Av와 [SA1(z)...]Umsa가 따로 있습니다. 코드에서는 A@V만 있는데 어떻게 연결지어서 봐야 할지 잘 모르겠습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mm_faster_rcnn_train_coco_bccd.ipynb 코드 오류 발생
선생님 안녕하세요.mm_faster_rcnn_train_coco_bccd.ipynb 코드 실행하다가 오류가 발생해서 해결방법을 모르겠어서 질문남깁니다..코드는 수정한건 없고 그대로 실행하였습니다. 버전도 통일했는데, 해당오류가 발생해서 혹시 해결방법을 알 수 있을까요?감사합니다
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
wget 문의
안녕하세요 선생님저는 주피터노트북으로 선생님 코드를 따라 실습해보고 있습니다.!wget -O /content/pretrained/yolov3.cfg https://github.com/pjreddie/darknet/blob/master/cfg/yolov3.cfg?raw=true 위와 같이 파일을 wget으로 다운로드 받을 때 마다wget.download(다운경로, 저장경로)로 구현하고 있었는데요.raw=True에 대해서는 주피터노트북으로 어떻게 구현할 수 있을까요?
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
pytorch downgrade 문의
안녕하세요,pytorch 1.13 설치하는 과정에서 아래와 같은 에러가 발생합니다. (주피터노트북 환경)원인과 해결 방법을 알 수 있을까요..?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
경로 설정 문의
안녕하세요!평소 파이썬 공부를 하다가 헷갈렸던 부분이 있는데,경로를 설정할 때 ./과 /의 차이에 대해서 알 수 있을까요?cv2_image = cv2.imread('./content/data/beatles01.jpg')cv2_image = cv2.imread('/content/data/beatles01.jpg')
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
iou 계산 식 문의
안녕하세요! 너무 좋은 수업을 들을 수 있어 감사합니다!질문이 있는데요,위 코드에서 iou를 구하려면 cand_box에서와 같이 gt_box의 2,3번째 값도 x max와 y max로 바꿔줘야 하는게 아닌가요??
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
한국번호판 머신러닝
안녕하세요~한국 번호판도 OCR 인식이 가능할까요?데이터셋에 필요한게 무엇이 있을까요? 한국 번호판은 생성을 했는데..groundtruth.csv 파일도 필요할까요?
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
CRNN_license_plate_data_fine_tuning_example_solution.ipynb 코랩 url 알려주세요.
pdf에 없는거 같아요.영상시작할때도 페이지 열려있는 상태에서 시작해서들어가는 방법을 모르겠구요.그리고 차량번호판 OCR때문에 영상듣는건데전체 프로젝트 파일은 따로 없는 건가요?
-
미해결따라하면서 배우는 3D Human Pose Estimation과 실전 프로젝트
[긴급] 강의자료 링크 깨짐
제공된 강의링크가 깨졌습니다! 필요한 강의 자료https://drive.google.com/file/d/1eeCo0WKkh1t0v6o_4lIOhR59SzKYUoX9/view?usp=share_link
-
미해결따라하면서 배우는 3D Human Pose Estimation과 실전 프로젝트
3d 데이터셋 gt는 카메라 좌표계 기준인거죠?
RT를 알 수 없으니 이미 어떻게 RT 반영되어서 적용된 데이터를 주는거죠?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection kitti customdataset 학습 시 오류
안녕하세요, 강의 잘 듣고 있습니다.train_detector(model, datasets, cfg, distributed=False, validate=True)실행 시키면, BrokenPipeError: [Errno 32] Broken pipe에러가 발생 하는데.. 이유를 잘 모르겠습니다 ㅜ