묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
from sklearn.datasets import load_boston
강의중 from sklearn.datasets import load_boston자료를 읽어올시 오류가 발생합니다.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
df.get_dummies 실행시 이진법이 아닌 false 또는 True로 반환됨.
df = pd.get_dummies(df, columns = ['Location', 'WindGustDir', 'WindDir9am', 'WindDir3pm']) MinTemp MaxTemp Rainfall Evaporation Sunshine WindGustSpeed WindSpeed9am WindSpeed3pm Humidity9am Humidity3pm ... WindDir3pm_NNW WindDir3pm_NW WindDir3pm_S WindDir3pm_SE WindDir3pm_SSE WindDir3pm_SSW WindDir3pm_SW WindDir3pm_W WindDir3pm_WNW WindDir3pm_WSW 0 13.4 22.9 0.6 4.4 8.2 44.0 20.0 24.0 71.0 22.0 ... False False False False False False False False True False 1 7.4 25.1 0.0 4.4 8.2 44.0 4.0 22.0 44.0 25.0 ... False False False False False False False False False True 2 12.9 25.7 0.0 4.4 8.2 46.0 19.0 26.0 38.0 30.0 ... False False False False False False False False False True 3 9.2 28.0 0.0 4.4 8.2 24.0 11.0 9.0 45.0 16.0 ... False False False False False False False False False False 4 17.5 32.3 1.0 4.4 8.2 41.0 7.0 20.0 82.0 33.0 ... False True False False False False False False False False 5 rows × 106 columns one hot encoding시에 이진법(0 또는 1)로 반환되어야하는데 false 또는 True로 반환됨.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇인가요?
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇일까요?알파값이 감소할수록 성능이 좋아지는 것인지 아니면 적당한 값이 있는것인지요?
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
수업자료 요청 skahffk94@naver.com
수업자료 요청부탁드립니다.skahffk94@naver.com
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
실습중에 주가_데이터.T.loc T는 무엇인가요?
my_df = 주가_데이터.T.loc['2020-09-09':,'A005930':'A005990']
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
parsererror
실습을 똑같이 따라하는 중인데 parsererror가 뜹니다.이유가 무엇을까요? 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) my_series = 주가_데이터.loc['A005930']['2020-09-09':] ParserError Traceback (most recent call last) <ipython-input-16-e728d7ea27ad> in <cell line: 1>() ----> 1 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) 2 my_series = 주가_데이터.loc['A005930']['2020-09-09':] 8 frames/usr/local/lib/python3.10/dist-packages/pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 583 fields in line 238, s
-
미해결파이썬 기초 라이브러리부터 쌓아가는 머신러닝
파일을 읽어들일 때 질문 있습니다
2분 44초 파일을 읽어들일 때 base_src 에 할당 할 때 machine_learning_data뒤에다가 바로 friend.csv을 이어서 붙이면 안되나요?
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??
마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
일반적인 질문 (kaggle notebook사용)
안녕하세요, 좋은 컨텐츠 만들어주셔서 진심으로 감사드립니다. 수강 중 일반적인 질문하나 드리고 싶습니다.kaggle notebook도 설치되어있는 패키지가 자동적으로 계속 업데이트가 될텐데, 이 경우 이후에 현재 작동중인 코드가 실행되지 못할수도 있을거 같다는 생각이 듭니다.이를 위해서 어떻게 제가 미리 조치를 하면 좋을까요?가령, 강의에서 사용하신 특정 버전 라이브러리로만 구성된 kaggle kernel을 생성한다던가 이런 방법이 있는지 혹은 가능한지 궁금합니다.감사합니다!
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask_rcnn활용, 데이터 coco 포맷 변환 오류
선생님 안녕하세요 저는 현재 cityscape dataset을 바탕으로 kaggle mask_rcnn_nucleus 코드를 활용하여 segmentation을 해보려고 하고 있습니다.그에 따라 cityscape 데이터를 nulceus 데이터와 동일한 구조의 디렉토리로 정리하였는데요,이를 coco 포맷으로 변환하려고 하니, 아래 오류가 떠서 문의드립니다.파일 경로는 모두 맞게 입력한 것 같은데, 이미지를 못 읽고 있는 것 같습니다.. 'convert_nucleus_to_coco' 함수를 수정하거나 하지 않았는데 왜 이미지를 못읽는 걸까요?(파일 경로)(오류 메세지)convert_nucleus_to_coco('/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/03_masks/aachen', train_ids, '/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/coco_output/train_coco.json') convert_nucleus_to_coco('/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/03_masks/aachen', val_ids, '/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/coco_output/val_coco.json') _____아래 오류 메세지_____ /content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/03_masks/aachen/aachen_000033_000019_gtFine_color/image/aachen_000033_000019_gtFine_color.png --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-63-d95f91ecbcb7> in <cell line: 1>() ----> 1 convert_nucleus_to_coco('/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/03_masks/aachen', train_ids, '/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/coco_output/train_coco.json') 2 convert_nucleus_to_coco('/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/03_masks/aachen', val_ids, '/content/drive/MyDrive/vision/DLCV_New-main/kaggle/train_data_jskim/coco_output/val_coco.json') <ipython-input-61-6f0ad3172ae3> in convert_nucleus_to_coco(data_root_dir, image_ids, out_file) 15 16 print(image_path) ---> 17 height, width = cv2.imread(image_path).shape[0:2] 18 # 개별 image의 dict 정보 생성 19 image_info = dict(file_name=file_name, AttributeError: 'NoneType' object has no attribute 'shape'
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
back propagation 관해 질문있습니다.
안녕하세요 교수님개념이 헷갈리는거 같아서 확인차 질문글에 남깁니다!퍼셉트론과 심층망에서 경사하강법을 통해 weight값을 갱신하는데 퍼셉트론은 hidden layer가 없어 손실함수에서의 parameter값의 편미분을 쉽게 할수있지만,hidden layer가 있는 심층망에서는 parameter에 대한 미분이 쉽지 않아, chain rule을 이용한 backpropagation으로 각 layer마다 전해지는 weight값의 편미분 값을 경사하강법 공식에 대입하여 weight값을 update하는게 맞을까요??제가 남들보다 이해력이 좋지않아서 죄송합니다.. ㅎㅎ..
-
미해결
현업 실무자에게 배우는 Kaggle 머신러닝 입문_ax list 문의
figure, ax_list = plt.subplots(nrows=3, ncols=5)figure.set_size_inches(20,20)for i in range(len(full_column_list)):sns.regplot(data=boston_house_df, x=full_column_list[i], y='PRICE', ax=ax_list[int(i/5)][int(i%5)])ax_list[int(i/5)][int(i%5)].set_title("regplot " + full_column_list[i]) 안녕하세요 현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁 수업 즐겁게 듣고 있습니다 : ) 여기서 ax = ax_list 부분 설명 좀 부탁 드리겠습니다. 만약 i를 안쓰고 개별 1개 칼럼에 대해 그래프를 그린다면 ax = 뒤가 뭔지 궁금합니다. 이것만 알아도 위 코드가 이해될 것 같습니다. 감사합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
필터 관련문의
강의 잘 듣고 있습니다.지금 CIFAR 데이터셋 CNN구현 실습 부분을 보고 있으면서 궁금한점 이 생겨 문의드립니다. 학습시 Conv2D, Activation, Maxpooling2D 같은 필터 개수는 어떻게 정의하는건가요 ? param이 어떻게 변하는지는 설명을 잘 해주셔서 이해했는데, Conv2D 등을 통해 필터시 어떤 기준으로 여러번 사용하는지가 이해가 안되내요. 감사합니다.
-
미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part3]
mac os에서 from lightbgm import LGBMClassifier 부분이 실행되지 않을 때
안녕하세요, 같은 문제를 겪는 분들이 있으실까 싶어서 함께 공유드립니다.저의 경우 아래와 같은 이슈가 있었습니다.!pip install lightgbm > 정상 설치 완료되었다고 안내가 떴지만, 이후 강의자료에서 각 라이브러리 임포트 시 no such file 에러 발생구글링 결과 맥 사용자 일부에게서 공통적으로 나타나는 이슈인 것 같습니다. (참고 링크: https://stackoverflow.com/questions/44937698/lightgbm-oserror-library-not-loaded) 저의 경우에는 터미널을 통해 cmake 어쩌고...나오는 부분은 이해가 되지 않아 다른 답변을 찾던 중, 주피터 노트북에서 아래와 같이 실행하면 해결되었다는 답변을 발견했습니다.conda install lightgbm위 코드를 실행하고 몇 분 간 기다리면 결과 화면이 쭈욱 나오는데요, 이때 강의자료에 있는 라이브러리 임포팅 코드들을 다시 실행했더니 정상적으로 lightgbm 라이브러리 임포팅이 완료되었습니다.다만, 처음에 답변을 달아 주신 분과 저 모두 m1 mac을 사용하는 환경에서 해결되었습니다. 위의 방법으로 해결되지 않으셨을 경우에는 첨부 드린 링크 참고하시면 좋을 것 같습니다.다들 파이팅입니다. 감사합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
실습 동영상 관련 질문
#Xception 모델 학습, 성능평가 및 예측 후 결과 분석하기 안녕하세요 선생님선생님의 코딩을 토대로 실습연습을 하고 있는데 질문이 있습니다 1.검증 데이터 성적이 너무 높으면 이 부분은 과적합이라고도 볼 수 있을까요(test-score가 아니라도)? 아니면 데이터의 양이 그냥 너무 적어서 발생하는 것일까요? (early stop으로 16에서 멈추고 val score = 0.97이 나옵니다)*데이터 크기: (5856, 2) 2.해당 자료가 0또는 1인데 (정상폐, 폐렴폐 ct)인데 loss =binary_crossentropy를 쓰면 될까요? (만약 categorical_crossentropy를 쓰면 문제가 발생하나요?) 3.만약에 데이터가 불균형하면 머신러닝에서 배웠던 것 처럼 -양성 데이터를 판별하는게 중요하다고 하면 metrics=['accuracy'] 이부분을 precision으로 할 수 있을까요? (반대로 음성이면 재현율)*model.compile(optimizer=Adam(lr=initial_lr), loss='binary_crossentropy', metrics=['accuracy'])4.선생님이 여기 실습에서 해당 데이터를 local? 영역에 넣으시고 분석하셔서 불러오는데 시간을 많이 줄인 것을 보았는데 바탕화면에 있는 데이터도 선생님이 하신 것 처럼 불러올 수 있을까요? 아니면 구글코랩처럼 따로 경로가 있을까요? (데이터를 불러오는데 1초이상이 걸립니다..) 감사합니다
-
미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part3]
''kaggle'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.' 문제가 발생했을 경우..
혹시나 수업을 들으면서 위와 같은 문제가 생기셨을 분들을 위해 남깁니다.시스템 환경 변수 -> 환경 변수 -> 시스템 변수 Path 편집 -> c:\users\<username>\appdata\roaming\python\python39\site-packages path변수에 추가해당 변수에 경로를 붙어넣기 해도 문제가 해결이 되지 않는 경우https://github.com/Kaggle/kaggle-api 참고하시면 좋을 것 같아요!
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
최근 등장한 CNN 아키텍처
강의 중에 나오는 최근 모델은 2017년 SENet 즈음이 마지막으로 나오는데구글링을 해봐도 SENet이 등장한 2017년이 최근 모델로 나오더라구요그나마 2019년 ResNeXt50 정도가 있는 거 같은데최근 3년 2020~2022년 사이에 개발된 CNN 모델이 있을까요?이러한 최신 CNN 경향은 어디서 확인하나요?
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
클래스 질문
안녕하세요. 강사님. 제가 이번 실습을 기반으로 병해충 진단 모델을 구축중입니다. 이에 대해 질문사항이 있어 질문드립니다.efficientNet모델로 딥러닝 모델을 만들고 있습니다. 총 16개의 병해충에 걸린 식물을 구분하는 모델입니다. output layer에서 최종적으로 예측하고 나온 16개의 확률값중에 가장 큰 확률값의 index가 4라고 할때 이게 어떤 식물인지 어떻게 아는건가요?..
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
미니배치 관련 질문
안녕하세요 선생님! BGD도 1:507 까지 모든 데이터를 순회하고 mini BGD도 사이즈를 나눠서 하지만 모든 데이터로 업데이트를 한다고 생각하는데 , 둘의 차이점이 무엇인가요?
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
1 x 1 convolution을 적용하면 왜 비선형성이 좋아지는지 궁금합니다.
선생님. 처음부터 쭉 듣다보니, 어느새 절반 이상을 듣게 되었습니다! 좋은 강의 감사드립니다. 1 x 1 convolution을 적용하면 왜 비선형성이 좋아지는지 궁금합니다. convolution은 시행할수록 비선형성이 항상 좋아지는것인가요??