묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결혼자 공부하는 머신러닝+딥러닝
텐서플로우의 GRU셀의 파라미터 개수에 대한 질문이 있습니다.
강사님 언제나 양질의 강의에 감사드립니다. 강의 덕분에 1회독을 수월하게 끝낼 수 있었습니다.다름이 아니라 텐서플로우의 GRU셀의 파라미터 개수에 대해 질문이 있습니다.538p의 GRU 방식에서는 Wg 뉴런에서 Wh, Wx를 한번에 처리하여 절편이 해당 뉴런에 하나 배정되었던 것으로 이해했습니다. 이전에도 파라미터의 개수를 계산할 때 절편은 뉴런당 하나이므로...의 방식으로 제일 마지막에 절편 개수를 더해왔구요.그런데 540p에서 Wh와 Wx를 계산하는 순서가 분리되어 개별적인 절편이 필요하다는 부분이 조금 이해가 되질 않습니다. 해당 부분을 '별도의 선형 방정식이 추가 된 것'이라고 설명 해주셨는데 추가적인 셀이 생성 된 것은 아니겠지요...?여태 제가 이해한 것이 '뉴런 당 절편 하나' 이어서 그런지 '별도의 선형 방정식이 추가 된 것'이라는 설명이 직관적으로 이해되질 않습니다... 실제로 538p의 Wg셀은 그대로이고 내부적으로 방정식과 별도의 절편만 추가 된 것으로 이해하면 될지, 아니면 Wh라는 별도의 셀이 추가 된 것으로 이해하면 될 지 궁금합니다
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
NMS 및 Confidence Score와 관련하여 질문이 있습니다.
안녕하세요. Mask RCNN으로 프로젝트 진행하던 중 하나의 객체에 대해 영역이 매우 유사한 BBox가 2개씩 나타나는 현상이 생겨 NMS에 관해 다시 공부하던 중 수행 로직과 관련하여 몇가지 궁금증이 생겨 글 남깁니다.우선 Confidence Score란 것이 단순히 박스안에 물체가 있을 확률을 의미하는 것인지, 아니면 박스안에 물체가 해당 Class일 확률을 의미하는 것인지 헷갈립니다. 단순히 물체가 있을 확률만을 의미하는 것이라면, 저의 경우에서 영역이 매우 유사한 BBox간은 IOU가 매우 높으니 제거되어야 하는게 아닌가요?? 만약 해당 Class일 확률을 의미하는 것이라면 NMS 과정이 예측된 Class별로 수행이 되는 것인지(ex. 차에 대한 BBox들끼리 NMS수행) 궁금합니다.학습 과정에서 문제가 생겼을 수 있다 판단하여 모델 전체를 재학습을 진행하고 있긴 합니다만, 위 질문들에 대해 궁금점이 남아 글 남깁니다.
-
해결됨[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지
안녕하세요! 질문이 있습니다
어제 질문 답변 감사드립니다! 궁금한게 해결되었습니다..ㅎ오늘도 질문이 좀 있어서 여쭤보고 싶습니다..! 혹시 augmentation을 한 뒤에 데이터셋을 저장하는 코드를 알 수 있을까요?예를 들어, 1000개의 이미지 데이터가 train_set에 있고, DataLoader에서 transform을 통해 이 1000개를 변형해가며 로드할텐데, 이 로드한 데이터들을 저장하고 싶습니다!다양한 augmentation을 통해서 기존 데이터의 3배정도인 3000개의 변형 데이터들을 저장하고 싶은데 코드를 어떻게 짜야할지 모르겠어서 질문드립니다. 요즘 예전 대회들에 있었던 불균형 이미지 데이터 분류를 연습하고 있는 중인데, 라벨이 총 10개에 어떤 라벨에는 데이터가 600개 가까이 되고, 어떤 라벨에는 데이터가 10개도 안되는 경우들이 있는 불균형이 매우 심한 데이터들입니다. 이 불균형을 weightedrandomsampler에 augmentation을 활용하여 불균형을 해소하고자 하였습니다. validation용으로 원본데이터에서 30%만큼 지정을 해 둔 뒤, train용으로 원본데이터를 weightedrandomsampler를 활용해 원본데이터를 변형하고 가중치를 주어 데이터가 적은 라벨의 데이터를 늘려 학습했습니다. 그 뒤에 아까 분리해 놓았던 validation데이터를 분류했습니다만... 평가기준인 weighted F1 score가 생각보다 낮게 나와서 고민입니다.. 제 생각에는 결국 validation 데이터에는 여전히 라벨별로 불균형이 매우 심한 상태이므로 라벨별로 동등한 양의 데이터로 학습한 모델에서는 제대로 예측을 못한것이 아닐까합니다. 그래서 위에서 질문한 코드를 통해 변형된 데이터에 원본 데이터를 합쳐서 학습을 시키고, 그 다음에 validation을 하면 약간은 나아질까 하는 생각이 듭니다만.. 호형님이라면 어떻게 하실지 궁금해서 여쭤봅니다. 질문이 너무 길고 장황해서 죄송합니다..ㅜ
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Segmentation Polyline
안녕하세요, 강사님.CVAT로 Segmentation 커스텀 데이터셋을 만들 때폴리곤을 이용하여 해당 영역을 마스크를 해주었을 때는 결과가 잘 나오는데폴리라인으로 영역을 표시해주고 테스트를 하니 마스크 형태로 영역이 잡혀서 나오더라구요.폴리곤이 아닌 폴리라인을 이용하여서는 segmentation 결과를 얻을 수 없나요?
-
미해결혼자 공부하는 머신러닝+딥러닝
순환 신경망의 순환층의 가중치에 대해 질문이 있습니다
강사님 언제나 친절한 답변에 감사드립니다.다름이 아니라 순환층의 가중치에 대해 질문이 있습니다영상 강의에서는 가중치 Wh, Wx를 설명해주실 때 Wx는 샘플마다 동일하게 사용되고, Wh는 타임스텝마다 동일하게 사용된다고 말씀해 주셨습니다. 그런데 492p의 세번째 문단에서 '모든 타임스텝에 사용되는 가중치는 Wh 하나라는 점 입니다'라는 설명에서 혼선을 느끼고 있습니다. 이미지를 참고하였을 때는 결국 매 스텝마다 입력에 대한 Wx, 이전 은닉상태에 대한 Wh 모두 사용하는 것으로 이해가 생각이 되는데 어떤 차이점이 있어서 이렇게 설명해주신걸까요?또 타임 스탭 1...3까지는 순환층 내부의 각각의 뉴런으로 이해되는데, 그렇다면 각각의 뉴런이 모두 동일한 Wx와 Wh를 가진다는 말씀이실까요? 아니면 Wx는 뉴런 별로 고유하되 Wh만 동일하다는 말씀이실까요? 493p에서 Wh의 개수가 9개라는 말이 Wh는 '하나의 값'이 아니라 각각의 뉴런이 다른 뉴런에게 전달한 각각의 값이기 때문에 각 뉴런에 3개씩 있다고 이해하는 것이 정확한지도 궁금합니다.또 타임스텝의 순서는 임의의 순서대로 1,2,3 이렇게 정해지는 것인지 여러가지 방법이 있는지도 궁금합니다
-
미해결AI 포트폴리오 만들기 - Airbnb 클론 프로젝트
강의자료
강의자료 요청합니다! soultab@naver.com입니다!
-
해결됨[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지
안녕하세요! 불균형 데이터 처리 과정중 augmentation에 대해 질문이 있습니다
imbalanced data를 처리할 때, weightedrandomsampler (replacement=True) 와 augmentation을 통해 불균형을 해소하고자 하는데, weightedrandomsampler에 있는 num_samples 파라미터에 관해 궁금한점이 있어서 질문드립니다. weightedrandomsampler가 작동하는 방법이, 샘플마다 가중치를 줘서 데이터 수가 적은 라벨에서는 더 높은 확률로 뽑히고, 데이터 수가 많은 라벨에서는 더 낮은 확률로 뽑혀서 결국 확률상 거의 같은 확률로 뽑도록 만들어서 불균형을 해소하는 걸로 알고 있습니다.이때, 만약 num_samples를 그냥 원래 train_sets의 길이로 지정을 하면 데이터가 적은 라벨에서는 augmentation을 통해 이미지를 변형해가며 오버샘플링이 된 것 처럼 샘플수가 증가되겠지만, 반대로 원래 데이터가 많던 라벨에서는 기존에 있던 데이터들에서 일부는 뽑히지 않을 수도 있지 않나요?예를들어 (1000,200,100)의 불균형 데이터가 있다고 했을때, 전체 데이터의 개수인 1300만큼 weightedrandomsampler에서 num_samples=1300으로 하고 추출을 한다면, 라벨별로 1300/3 = 433개씩 뽑힐텐데, 이러면 첫번째 라벨의 데이터는 1000개에서 433개를 뺀 567개는 그대로 누락되는건가요?만약 그렇다면 num_samples를 더 큰 숫자로 해서 가지고 있는 데이터를 전부 불러오려고 한다면, 소수의 데이터를 너무 많이 재활용해서 과적합이 될까요?
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
true function에 대해 이해가 잘 안되서 질문 남깁니다
학습 데이터를 통해 모델을 학습 시켰을 때 true function이 나오는 건가요? 아니면 학습 데이터를 통해 모델을 만든 이후에 모델의 검증을 위한 검증 데이터를 넣었을 때 true function이 나오는 건가요?ture function이 만들어지는 시기가 언제인가요?
-
미해결처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part4]
MNIST 데이터 DNN 학습시키는 반복문 안에 minibatch 관련 질문
# 질문 1. 아래와 같이 model 안에 x_minibatch, y_minibatch를 넣고 학습을 시키는 과정인데 결국 train_batches의 차원은 (375,128,1,28,28) # 48000/128=375 x_minibatch 의 차원은 (128,1,28,28) 여기서 model의 input의 차원은 (128,784) 가 맞을까요? 결국 한번 model 넣을 때마다 128개의 data가 학습되는 건가요? DNNModel에는 input 차원이 (784,)인 1개의 데이터가 들어가서 output으로 (10,) 데이터를 출력한다고 알고있어서 조금 개념이 충돌하는 것 같습니다. # 질문 2. train_batches의 type이 torch.utils.data 이라 shape을 알기 어려워 행렬 구조가 눈에 안들어오는데 따로 보는 방법이 있을까요? model.train() # prep model for training for x_minibatch, y_minibatch in train_batches: y_minibatch_pred = model(x_minibatch.view(x_minibatch.size(0), -1)) loss = loss_func(y_minibatch_pred, y_minibatch) optimizer.zero_grad() loss.backward() optimizer.step() train_loss += loss.item() train_loss = train_loss / len(train_batches) train_losses.append(train_loss)
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Selective Search를 도면에서 특정 기호 찾는 데 활용할 수 있을까요?
안녕하세요. 선생님의 강의를 열심히 듣고 있는 직장인입니다.다름이 아니라 설계도면에서 특정 기호를 찾아야 하는 업무가 있는데 Selective Search를 이용하여 특정 기호의 이미지를 먼저 인식시키고, 그 다음에 입력되는 도면들에서 해당 기호가 있는 곳을 표시하는 작업을 해보고 싶습니다.해당 방법을 이용하면 될지, 아니면 더 좋은 방법이 있을지 문의드립니다.
-
해결됨U-Net 구현으로 배우는 딥러닝 논문 구현 with TensorFlow 2.0 - 딥러닝 의료영상 분석
Unet 을 회귀문제에 적용할 수 있을지요?
안녕하세요? U-net 을 회귀문제에 활용하는 방안 관련 몇 가지 질문을 드리고자 합니다.예를 들어 위 그림의 왼쪽과 같이 부재의 design 특징을 가지는 section image 와 속도 등의 value 를 input 을 받아서 오른쪽 그림과 같이 부재의 주변의 온도 프로파일을 예측하고자 한다면 (특정 design 에 대한 simulation 을 대체하는 딥러닝 모델을 구축해 보고자 하는 경우)예를 들어 온도의 연속형 데이터를 급간을 만들어 범주형으로 변환한다면 본 강의의 예제 처럼 범주의 개수만큼 출력 layer 를 만들어 segmentation 문제로 정의 할 수 있을 것 같은데요,질문1) 예를 들어 위 그림의 오른쪽 시뮬레이션 결과 이미지의 RGB 값을 학습용 label 데이터로 사용하는 것이 아닌, 해당 이미지의 좌표에 따른 온도 숫자 자체 value 들을 연속형 데이터로 받아서 output 이미지 픽셀값에 매핑시킨 2차원 데이터를 output 이미지(?) 로 사용한다면, 동일한 U net network 를 가지고 회귀문제로 예측 모델을 만드는 접근이 가능한 것인지 문의드립니다. (U-net 으로 회귀문제를 푸는 예제를 거의 찾아보지 못해서 질문 드립니다.)이유는 온도 수치를 범주로 정의하게 되면 예측하고자 하는 수치 정보의 해상도를 낮추게 되어 오차를 만들어 낼 테니까.. 연속형 자료를 범주형 자료로 변환하는 과정에서 발생하는 오차를 원천적으로 없애고, 2차원 혹은 3차원에 존재하게 될 숫자 정보를 최대한 있는 그대로 예측하기 위함입니다.질문2) 만약 위와 같이 Unet 의 출력 layer 를 segmentation (범주) 가 아닌 각 픽셀 위치당 숫자를 예측하는 회귀 문제를 예측할 수 있도록 재구성한다면, 출력 layer 를 구체적으로 어떻게 구성해야 하는지요? 단순히 최종 layer 의 Conv2D 의 activation = 'linear' 로 정의하면 될지요?질문3) 이어지는 질문이지만 본 단원 강의 내용에서 이해해 보면 Unet 활용 시, 범주를 예측하는 segmentation 문제에서는 출력 layer 의 채널 수를 범주의 class 개수로 정의하는 듯 한데.... 픽셀 위치에 mapping 되는 value 값을 예측하는 회귀 문제로 접근하는 경우, 최종 Conv2D layer 의 채널 수를 어떻게 설정해야 하는는지.. 문의드립니다. (단순히 1채널로 정의하면 될지요?)질문4) 2D 혹은 3D 이미지 혹은 모델링을 input 받아서 2D or 3D 공간상의 숫자들을 예측하는 딥러닝 모델을 구축한다면... u-net 이 최선일지.. 혹은 알고 계시거나 경험해 보신 다른 네트워크 모델이 있을지... 강사님의 고견을 듣고 싶습니다. ^^;;
-
해결됨혼자 공부하는 머신러닝+딥러닝
은닉 상태에 대한 질문이 있습니다
강사님 언제나 친절한 답변에 감사드립니다.다름이 아니라 490p에 은닉 상태 이미지에 관해 질문이 있습니다.하단의 도움말을 참고하면 '앞의 그림 O도 은닉상태랍니다'라고 적혀있는데, 이 말이 의미하는 것이 두번째 타임스탭부터는 이전 층의 출력이 재사용되기 때문에, 셀도 출력에 포함되는 것으로 생각하면 된다는 말씀이 맞을까요?그 부분이 직관적인 이해가 되질 않습니다
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
셔플 시, target과 데이터가 섞일 때
제가 강의를 들으며 사이킷런에 iris 샘플을 가지고 data와 target을 나누고 있는 와중에 문득 궁금한 점이 생겼습니다.train_test_split을 통해 train셋과 test셋을 나누게 되는데 shuffle이 True로 되어 있기 때문에 자동적으로 shuffle이 수행되지않습니까? 이 때 샘플데이터와 타겟은 짝을 지어서 셔플이 되는 건가요? 아니면 샘플데이터도 타겟 데이터도 둘 다 아무렇게나 섞이는 건가요?
-
미해결Google 공인! 텐서플로(TensorFlow) 개발자 자격증 취득
(재등록) 슬렉 메일이 안와요..
다른 메일로 받고싶어서 4월 9일에 올려서 답변도 받았는데.. 안왓습니다...... jkw06444@gmail.com
-
미해결모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌
강의자료 ppt
안녕하세요 처음 배워보려고 해서 찾아찾아 오게됐습니다 강의 너무 좋은데 강의하시는 ppt가 따로 제공이 되는건지 궁금해서요~혹시 제공된다고 제가 어디서 찾을 수 있을까요??
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
선생님 질문입니다!
3:23 에서 질문을 드리고 있습니다!예측 BBbox 와 positive 좌표차이가 Ground truth와 positive 좌표차이와 같게 만든다고 하셨는데 가령 빨간점이 파랑 점과의 거리 가 같은 곳은 무수히 많다고 생각하는데 단순히 거리를 줄이는 것이 어떤 원리로 regression이되는지 이해가 되지 않습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask 없이 mask-RCNN 사용이 가능할까요??
안녕하세요 선생님,궁금한 점이 생겨 이렇게 질문 남깁니다.지금 torchvision의 faster r-cnn을 이용해서 object detection 프로젝트를 수행하고 있는데여기서 제가 궁금한 점은 2가지 입니다.사용하고 있는 데이터가 mask 정보가 없는, bounding box와 카테고리 정보만 담겨있는 custom data인데 mask정보 없이 mask R-CNN에서도 실행해볼 수 있을까요??mask 정보 없이 mask R-CNN을 사용하는 것은 faster R-CNN을 사용하는 것과 차이가 없을까요?? 1번을 시도하는 것은 의미 없는 일인 것인지 궁금합니다.감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
선생님 질문입니다!
1:01의 그림을 보면서 질문드리고 있습니다!원래 CNN을 거치면 FC layer에 가기전에 여러개의 피처맵을 Flatten 해서 맞춰주는데 지금 그림에서 Conv Network를 통과한 feature 이미지는 하나만 있다고 표현되는데 왜 그런건가요? 제 생각대로라면 Flatten이 되기전에는 여러 피처맵이 있는걸로 알고 있습니다.그리고 이미 vggnet 을 통해서 나온 피처맵을 3*3 conv를 하는 이유를 모르겠습니다. conv를 적용하지 않고 그냥 1*1 conv를 하는 것이 나을거라 생각하는데 이해가 잘 되지 않습니다.
-
미해결혼자 공부하는 머신러닝+딥러닝
합성곱 신경망 파트에 대해 질문이 있습니다.
안녕하세요 강사님. 먼저 늘 유익한 강의에 감사드립니다.다름이 아니라 합성곱에 대해 공부 중 두 가지 의문이 생겨 질문드립니다.1. 451p 신경망 생성을 그림으로 요약한 표 입니다.이미지가 필터를 거칠 때, 필터는 슬라이딩 하듯이 이미지 위를 이동하는 것으로 이해했습니다. 그런데, 몇 차례 이동을 거쳤을텐데 원본과 같은 크기의 이미지를 반환합니다. 반환된 이미지는 어떤 기준으로 계산되는건지 궁금합니다.2. 473p에서 두번째 문단에, '우리에게 필요한 것은 첫번째 conv2D의 출력입니다. model 객체 입력과 conv2D의 출력을 알 수 있다면 둘을 연결하여 새로운 모델을 얻을 수 있지 않을까요?' 부분의 맥락이 이해가 되질 않습니다. 여기서는 왜 새로운 모델을 만들려고 하는걸까요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
multi-class segmentation mask일 때 COCO format으로 변환하는 방법
구글링을 해도 도저히 답을 못 찾겠어서 질문 드립니다. 지금 맡고 있는 프로젝트에서는, 총 4개의 class가 masking되어있는 이미지 형태로 annotation이 준비되어 있고 이걸 json annotation으로 만들어야 하는데 이럴 경우에는 어떻게 해야 하죠?