묻고 답해요
137만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2에서 언제는 분류모델을 써야하고 언제는 회귀모델을 써야할까요?!
보통 작업형2에서는 예측값을 물어보는 문제가 나오던데요.문제가 나올때 어느문제는 분류모델을, 어느문제는 회귀모델을 사용해야하는지 궁금합니다.지금까지 강의+기출문제를 보면서는 분류/회귀를 결정하는 부분이 평가 모델을 통해 진행된다는 느낌을 받았는데요. 1) roc_auc_score, accuracy_score 이 평가모델로 쓰일 경우,분류형 모델 사용(Classifier) 2) rmse, mean_squared_error 이 평가모델로 쓰일 경우,회귀모델 사용(Regressor) 이렇게 생각하면서 작업형2를 접근하는게 맞는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 선생님, 질문은 3가지 입니다. 1) 저는 문제를 딱 접했을때 분류모형을 써야할지, 예측모형을 써야할지 판가름을 정확하게 못하는 것 같습니다. 쉽게 판별하는 방법이 있을까요? 2) 이 문제의 경우 target인 output 컬럼을 train.head() 로 보면 0과 1로 구분되어있어서, 0 또는 1로 분류하는(분류모형) 것인가 생각했다가도 문제 맨위에서 참조해주는 예시에서 id,output 41,0.633 28,0.123 222,0.355를 보면 output이 확률값으로 되어있어서 회귀모형을 사용해야하는 것인가? 라고 헷갈리곤합니다. 어디서 개념을 잡지 못하는 것일까요 3) 최종 예측을 할때pd.DataFrame({'id':test_id, 'output':pred_proba[:,1]}).to_csv("00000.csv", index=False)output에 pred_proba 를 쓰셨는데 참조예시에서 확률값을 OUTPUT에 담았기 때문에 pred_proba를 사용한 것일까요?그렇다면 output에 pred 를 담는 경우는 어떤 경우인지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제3 7번문제
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요df = df.T df.head() mean_2001 = df[2001].mean() mean_2003 = df[2003].mean() a = sum(df[2001] > mean_2001) b = sum(df[2003] < mean_2003) print(a+b)이렇게 작성하면 결과가 다르게 나오는데,, 어디서 잘못된 것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
윌콕슨 검정 질문입니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 무게에서 - 120을 뺀 이유가 무엇인가요?
-
미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
한단계 더 이해하는 EDA와 데이터 타입에 따른 시각화 기법5
위 코드를 실행하니 'could not convert string to float: 'Abbeville' 라는 에러가 전시됩니다.Abbeville를 float으로 바꿀 수가 있나요?
-
미해결
python pandas dataframe을 엑셀 vlookup처럼 활용하고 싶은데 쉽지 않습니다. 도와주세요
하고 싶은 것일부 주문이 서비스 유형: 픽업임에도 배달메뉴코드로 생성되어 이를 찾고 싶습니다. (배달메뉴와 픽업메뉴 코드는 서로 다름)엑셀 vookup을 사용해서 상품코드를 배달 메뉴 테이블에서 검색하고, 검색되지 않으면 오주문으로 판단하는 코드를 구현했습니다. 같은 프로그램을 파이썬을 통해 구현해보고 싶은데, 다른 dataframe에 없는 값을 찾아 행을 추가하는 과정이 어려워 조언을 구하고 싶습니다. 파이썬 코드df_pickup = 픽업 주문내역 데이터 프레임 delivery_menu_code = df_delivery_menu["상품코드"] df_misorder = pd.DataFrame() # 픽업 주문내역에서 상품코드를 꺼내 해당 상품코드가 배달 메뉴 코드에 포함되어 있는지 확인 # 만약에 코드가 없으면 해당 row를 df_misorder에 추가 for idx, row in df_pickup.iterrows(): misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na = False)] if len(misorder) != 0: df_misorder.concat(row) else: pass # 어떻게 추가해도 계속 0개로 나와서, 도와주시면 감사드리겠습니다! len(df_misorder)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
train 데이터를 별도 분리안하고 범주형은 라벨 인코더로 스케일링하고나서 수치형데이터도 값이 큰건 minmaxscaler나 robustscaler로 적용하고 싶어서 개별 컬럼 선택해서 적용해보는데... 에러가 뜨는데 머가 문제인지 알수 있을까요?수치형 범주형 개별로 스케일링 하고 싶으면 데이터를 분리했다가 다시 합쳐야 하는 걸까요?train['Total_Trans_Amt'] = scaler.fit_transform(train['Total_Trans_Amt']) test['Total_Trans_Amt']=scaler.transform(test['Total_Trans_Amt'])
-
미해결파이썬/장고 웹서비스 개발 완벽 가이드 with 리액트
장고로 엑셀파일 편집 홈페이지 만들기 질문입니다
안녕하세요 장고로 홈페이지를 만들고 있는데 궁금한 것이 있어서 질문남겨봅니다여러 엑셀파일을 업로드 해서 각 엑셀파일별로 편집 후 파일들을 하나로 합쳐서 다운로드 받게하려는 기능을 구현하려고 하고 있습니다각 파일별 업로드 후 편집하는 것 까진 구현했는데 그 파일들을 하나로 합쳐서 다운로드 하는 것이 구현이 안되는 상황입니다이럴때 함수로 그 파일들을 합쳐서 다운로드도 가능하게 할 수 있을까요?별도의 데이터베이스는 사용하지 않으려고 합니다장고쪽인지 또는 html쪽 문제인지 궁금합니다해당 코드의 주소입니다how to merge excel file with python django - Stack Overflow감사합니다
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
numpy의 shape
안녕하세요 인프런에서 강사님의 강의(파이썬을 활용한 머신러닝 딥러닝 입문)를 수강 중인 손승운입니다.질문'파이썬을 활용한 머신러닝 딥러닝 입문' 강의 12강 내용 7분 18초를 보면 주피터 노트에서는 z.shape의 값이 (axis2, axis0, axis1) 순서로 나오고 제가 직접 주피터노트에 실습한 결과도 동일했습니다.하지만 7분 33초 중앙을 보면 shape를 (axis0, axis1, axis2)로 표현하셨는데, 이는 구글링을 통해 다른 사람들이 표현한 것과 같습니다.그럼 (axis2, axis0, axis1)와 (axis0, axis1, axis2) 둘 중 어느 것이 맞는 표현인가요? 혹시 원래는 (axis0, axis1, axis2)로 표현해야 하지만 numpy를 활용해 shape를 볼 때만 (axis2, axis0, axis1)로 표현되는 건가요?강사님의 강의 덕에 머신러닝 개발자가 되는데 한걸음 내딛을 수 있었습니다. 감사합니다. 편하신 시간에 답변주시면 감사하겠습니다.
-
미해결금융데이터 분석을 위한 판다스 활용법
append
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.안녕하세요, 시리즈 추가하는 append에서 이러한 오류가 뜹니다. FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead. concat 으로 바꿔서 하니,'DataFrame' object has no attribute 'concat'이런 오류가 뜨구요. squeeze가 돌아가지않아 빼고해서 dataframe 상태입니다.
-
해결됨금융데이터 분석을 위한 판다스 활용법
squeeze 오류
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. series 불러올때 squeeze 입력하면 오류떠요.The squeeze argument has been deprecated and will be removed in a future version. Append .squeeze("columns") to the call to squeeze.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메뉴 중에 '카페라떼'에 해당하는 가격만 보고 싶을 때는?
안녕하세요, 강의를 듣다가 궁금해서 질문을 남겨 봅니다. df.loc[1, "가격"] 이렇게 해주면 4600이렇게 해당하는 가격이 나오는 건 알겠는데요.혹시 카페라떼의 행번호르 선택하지 않고, 순수하게 "카페라떼"여기에 해당하는 가격만을 검색해서 볼 수 있는 방법은 알 수 없을까요? 듣다보면 알려주실 거 같긴 한데, 갑자기 궁금해져서 이런저런 방법을 시도해도 안 돼서 이렇게 여쭙습니다.
-
미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
mac os에서 from lightbgm import LGBMClassifier 부분이 실행되지 않을 때
안녕하세요, 같은 문제를 겪는 분들이 있으실까 싶어서 함께 공유드립니다.저의 경우 아래와 같은 이슈가 있었습니다.!pip install lightgbm > 정상 설치 완료되었다고 안내가 떴지만, 이후 강의자료에서 각 라이브러리 임포트 시 no such file 에러 발생구글링 결과 맥 사용자 일부에게서 공통적으로 나타나는 이슈인 것 같습니다. (참고 링크: https://stackoverflow.com/questions/44937698/lightgbm-oserror-library-not-loaded) 저의 경우에는 터미널을 통해 cmake 어쩌고...나오는 부분은 이해가 되지 않아 다른 답변을 찾던 중, 주피터 노트북에서 아래와 같이 실행하면 해결되었다는 답변을 발견했습니다.conda install lightgbm위 코드를 실행하고 몇 분 간 기다리면 결과 화면이 쭈욱 나오는데요, 이때 강의자료에 있는 라이브러리 임포팅 코드들을 다시 실행했더니 정상적으로 lightgbm 라이브러리 임포팅이 완료되었습니다.다만, 처음에 답변을 달아 주신 분과 저 모두 m1 mac을 사용하는 환경에서 해결되었습니다. 위의 방법으로 해결되지 않으셨을 경우에는 첨부 드린 링크 참고하시면 좋을 것 같습니다.다들 파이팅입니다. 감사합니다.
-
해결됨파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
가상환경에서 FinanceDataReader import
오류패키지목록, 3.6파이썬 환경에서 FinanceDataReader import하는데 오류가 나네요jupyter-lab으로 실행 시 오류없이 진행가능하나 vscode로 진행해보고 싶어서 혹시 답변 가능할까요구글링 열심히 했는데 잘 모르겠네요
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
한국거래서 상장종목 에러
기존에 있었던 Market(시장)이 데이터에 없어서 예제코드 일부가 커밋이 안되고 있습니다. fdr 라이브러리를 사용해야하는 걸까요? 진행이 안되어 답답합니다.감사합니다.
-
미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
''kaggle'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.' 문제가 발생했을 경우..
혹시나 수업을 들으면서 위와 같은 문제가 생기셨을 분들을 위해 남깁니다.시스템 환경 변수 -> 환경 변수 -> 시스템 변수 Path 편집 -> c:\users\<username>\appdata\roaming\python\python39\site-packages path변수에 추가해당 변수에 경로를 붙어넣기 해도 문제가 해결이 되지 않는 경우https://github.com/Kaggle/kaggle-api 참고하시면 좋을 것 같아요!
-
미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
4강 코드 오류메세지 관련 질의
4r강 마지막에 연산자 적용관련하여 df[df.b == 7] | df[df.a == 5] 라고 코드를 똑 같이 했는데 unsupported operand type(s) for |: 'float' and 'bool' 라고 오류메세지가 나옵니다. 왜이렇게 나오는지가 궁금합니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
레티나 디스플레이 관련 질문
윈도우에서는 레티나 디스플레이 코드로 설정을 해도 표에서 달라진게 없는거같은데 혹시 맥 전용 기능인가요..?
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
워드클라우드 실행 오류
이와같은 오류메시지로 실행이 안되는데 해결책 알수 있을까요 선생님 ㅜ
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
[2/5] plotly express 를 통한 일별 시세 시각화
plotly express 예제 중 질문입니다.1. 우분투 버전(base) root@gd-virtual-machine:~# cat /etc/issueUbuntu 20.04.4 LTS \n \l2. 파이썬 버전(base) root@gd-virtual-machine:~# python --versionPython 3.9.73. 공부하는 부분[2/5] plotly express를 통한 일별 시세 시각화px.line 을 처음에 실행하면 그래프가 나옵니다.그러나, 저장된 파일로 실행하면 그래프가 안 나옵니다.이런 경우도 보셨나요?4. 해당 소스import plotly.express as pximport pandas as pddf = px.data.stocks()dfpx.line(df, x="date", y="GOOG") 처음 실행은 정상적으로 그래프가 나옴저장된 파일로 실행하면 비정상적으로 그래프가 나오지 않음