묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
test_size
test_size 와 random_state를 정하는 기준이 따로 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
고유값 개수 확인
데이터 전처리 할때 컬럼의 고유값 개수를 알아보는 이유가 인코딩을 어떻게 할지를 알아보려고 한다고 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
roc_auc_score 문자형
안녕하세요. roc_auc_score문자형에서 양의 값이 두번째 컬럼인 B일 확률을 의미하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류 질문
왜 이런 오류가 나는 지 궁금합니다 .그리고 혹시 오타가 난 채로 실행을 했을 때 이를 정정할 수 있는 방법도 있을까요?예를 들어, teest = test.pop['CLIENTNUM'] 이렇게 실행을 해버렸을 때 다시 정정가능한 방법있나요?
-
미해결FastAPI 완벽 가이드
영상 문의
'FastAPI에서 StaticFiles 클래스를 이용한 정적 파일 다루기' 수업 끝에 url_for 다음시간에 알려주신다고 영상이 끝나는데, 해당 강의영상은 어디에서 볼 수 있을까요? ps. 수업 너무 알차게 잘 듣고 있습니다 :)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼명 선택
cols = train.select_dtypes(include = 'object') 이런식으로 코드를 작성해서 전처리를 하면 문제가 생기나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션11 작업형2 문의
안녕하세요,섹션11 작업형2에서 문의드리고 싶은 것이 있습니다.아래 코드에서 train[cols]와 같이 cols를 선택하여 train 데이터셋을 분할하였음에도 불구하고,model.fit(X_tr[cols], y_tr)과 같이 모델학습 시에 파라미터에 값을 넣을 때도 반드시 따로 cols를 선택해서입력해야 하나요? 그리고, train 데이터셋에서 과적합을 방지하기 위해 id를 제거할 경우, 반드시 test 데이터셋도 동일하게 id 컬럼을 제거해줘야 하나요? 위 두 가지 문의드립니다. ############ from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train[cols], target, test_size = 0.2, random_state = 0) from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier()model.fit(X_tr[cols], y_tr)pred = model.predict_proba(X_val[cols])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pred 데이터프레임 행 개수 문의
안녕하세요 섹션11 예시 문제를 아래와 같이 작성해보았는데,모델을 통해 예측한 결과의 데이터프레임 shape이 평가용 데이터 개수와 동일하지 않고 학습용 데이터 개수와 동일하게 생성되었습니다.아래 코드의 어떤 부분에서 실수한 것인지 문의드립니다ㅠㅠ############################import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# 사용자 코딩# 결측치 채우기train['환불금액'] = train['환불금액'].fillna(train['환불금액'].mean())test['환불금액'] = test['환불금액'].fillna(test['환불금액'].mean())# 회원 ID 제거, test 데이터셋의 id는 일단 남겨둠# train = train.drop(['회원ID'], axis = 1)# test_id = test.pop('회원ID')# 타겟 데이터 분리X_train = train.drop(['성별'], axis = 1)y_train = train['성별']# 수치형 데이터, 범주형 데이터 구분n_train = X_train.select_dtypes(exclude = 'object')c_train = X_train.select_dtypes(include = 'object')n_test = test.select_dtypes(exclude = 'object')c_test = test.select_dtypes(include = 'object')# 수치형 데이터 Standard Scalingfrom sklearn.preprocessing import StandardScalercols = list(n_train.columns)scaler = StandardScaler()n_train[cols] = pd.DataFrame(scaler.fit_transform(n_train[cols]))n_test[cols] = pd.DataFrame(scaler.transform(n_test[cols]))# 범주형 데이터 Label Encodingfrom sklearn.preprocessing import LabelEncodercols = list(c_train.columns)for col in cols:le = LabelEncoder()c_train[col] = le.fit_transform(c_train[col])c_test[col] = le.transform(c_test[col])# 데이터들 다시 합침X_train = pd.concat([n_train, c_train], axis = 1)test = pd.concat([n_train, c_train], axis = 1)# train 데이터, validation 데이터 분리from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(X_train, y_train, test_size = 0.15, random_state = 0)# RandomForest 수행from sklearn.ensemble import RandomForestClassifierrf = RandomForestClassifier(random_state = 0)rf.fit(X_tr, y_tr)pred_proba = rf.predict_proba(X_val)# 검증from sklearn.metrics import roc_auc_scoreprint(roc_auc_score(y_val, pred_proba[:,1]))##################### baseline : 0.6064200601928629# 회원 ID 제거 안 함 : 0.6098212640501197# 실제 예측pred = rf.predict(test)submit = pd.DataFrame({'pred' : pred})submit.to_csv("result.csv", index = False)result = pd.read_csv("result.csv")print(result.shape)# 답안 제출 참고# 아래 코드는 예시이며 변수명 등 개인별로 변경하여 활용# pd.DataFrame변수.to_csv("result.csv", index=False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 4번 문제 중 select_dtypes
안녕하세요 !수업을 듣던 중 궁금한 점이 생겨 질문해봅니다.작업형1 모의문제2 4번 문제에서 object형 컬럼을 뽑기 위해 select_dtypes를 사용하셨는데 혹시 describe를 사용하는 건 안 되는 걸까요?두 함수의 차이점이 궁금하고 결과에서 어떤 차이가 생기는지 궁금합니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 및 범주형 데이터 분리
안녕하세요 선생님수치형 데이터(n_train, n_test)와 범주형 데이터(c_train, c_test)를 분리하여 처리하는 이유가 있을까요? 분리했다가 합치는게 직관적으로 잘 이해가 안되어서요. X_train[cols] 또는 X_test[cols]로 처리하면 안되나요?아 그리고 train data만 fit_transform하고 test data는 transform만 하는 자세한 이유도 궁금합니다. 아직 학습 모델링 적용 전에 전처리 하는 과정에서도 학습을 하는건가요? (수치형만 학습, 범주형 중 원핫인코딩은 학습이 없는 것도 이유가 궁금합니다. )미리 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 1번 궁금합니다.
앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 구하시오 라고 한다면, df = df[:int(len(df) * 0.7)]는 슬라이싱이라 끝 값이 포함 안되지 않나요,,? df2 = df.loc[:int(len(df) * 0.7)] 이렇게 되어야 하지 않나 해서 문의드립니다.
-
해결됨실리콘밸리 엔지니어가 가르치는 파이썬 기초부터 고급까지
__repr__ 와 __str__ 차이점?
__repr__과 __str__의 차이점은 무엇인가요?
-
해결됨실리콘밸리 엔지니어가 가르치는 파이썬 기초부터 고급까지
class method vs static method
class method와 static method는 각각 어떤 목적으로 사용되는건가요?타 언어의 static class method와 비슷한 느낌인데, replit 에서 테스트 해보니 instance로도 해당 method 들을 call 할 수 있던데, 각 method type의 목적과 사용 예시를 알고 싶습니다.
-
해결됨실리콘밸리 엔지니어가 가르치는 파이썬 기초부터 고급까지
Type hint 문법의 Type Checking이 강제성이 있는지?
Type hint를 작성했을때(특히 function의 args type과 return type) Type Checking을 언어단에서 해주는건가요? (강제성이 있는지? Interpreting 과정에서 Type Checking을 해주는건지?) 아니면 정말 순수하게 코딩 작업의 Hint 목적으로만 존재하는 문법인가요?
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
1-9. [노하우] 기존에 열린 한글 프로그램을 파이썬으로 제어" 관련 질문 3가지
"1-9. [노하우] 기존에 열린 한글 프로그램을 파이썬으로 제어" 관련하여 질문드립니다. 질문1. 일코 님은 Jupyter Notebook을 사용하고 있는건지 아니면 파이참에 IPython을 설치한 것인지요?일코님의 움짤 동영상에서는, 파이썬 콘솔 내에서 In [7]: In [8]: In [9]: 같은 식으로 보여지는데,제 파이참의 파이썬 콘솔 내에서는 그러한 것이 보이지 않아서 궁금하여 여쭤 봅니다. 질문2. hwp.Run("FileClose") 은 hwp.Clear() 와 어떻게 다른가요? 질문3. 움짤 동영상에서의 진행과정은 아래에 제가 기록한 내용이 맞나요? 혹시 잘못 이해한 부분이 있는지 확인 후 피드백 부탁드립니다. ■ 움짤 동영상 진행내용 분석 ※ 일코님의 움짤에 있는 코딩 툴을 파이참으로 추정하였으나, 확실치는 않음. 00:00:01 예문모음.hwpx 파일을 더블클릭하여 오픈한다. hwpx의 10/10 페이지가 보임 00:00:03 1/10 페이지로 이동한다. 00:00:06 ( 파이참 화면 중 에디터(Editor)에위의 코드 전체(기존에 열린 한글 프로그램을 파이썬으로 제어)가 보임. ) 00:00:07 에디터(Editor) 화면을 최소화하고, 파이썬 콘솔 영역을 크게 확대함. 00:00:10 파이썬 콘솔에서,In [7]: 상태에서,hwp.Path 타이핑 후 엔터를 치니, 뭔가 오류 같이 빨간색으로 10줄 정도 뜬다.※ 미리 열어놓은 hwpx 파일을 Path를 얻어오는데 실패한 걸 보여주는 듯 함. 00:00:12 상단 메뉴바 중 Edit를 클릭하는 것 같음.그 즉시 에디터(Editor) 화면이 절반정도를 차지하도록 커짐.파이참 화면 중 에디터(Editor)에,위의 코드 전체(기존에 열린 한글 프로그램을 파이썬으로 제어)가 보임. 00:00:13 블럭지정해서 코드 복사(ctrl + c) 한 거 같음. 00:00:14 파이썬 콘솔에서,In [8]: 상태에서,아까 복사해 둔 위의 코드 전체를 붙여넣고 엔터를 친 것 같음.그 직후 별도의 빨간 텍스트가 안뜨는 걸로 봐서 정상적인 진행으로 보임. 00:00:15 In [9]: 상태에서,hwp.Path 타이핑 후 엔터를 치니,흰색으로 Out[9]: 'C:\\Users\\Administrator\\Desktop\\예...라고 뜨는 걸로 봐서, hwp.Path가 제대로 작동되는 것을 보여주는 듯 함. 00:00:19 에디터(Editor)와 파이썬 콘솔이 반반이던 화면에서,에디터(Editor) 화면이 최소화 되고 파이썬 콘솔 영역이 크게 확대됨.파이썬 콘솔 최상단 줄에 빨간색 텍스트로,pywintypes.com_error: (-2147023174, 'RPC 서버를 사용할 수 없습니다.'라고 보이는 것은, 아까 In [7]의 결과가 보이는 것임. 혼동 주의 00:00:22 파이썬 콘솔의 좌측 패널 상단의 아이콘들 중 안경모양 아이콘을 클릭한 듯 함.그 즉시 우측에 보이던 패널이 오른쪽으로 밀려 닫히며 안보임. 00:00:22 이 화면에서는, 아까 In [8]: 상태에서 코드 전체를 붙여넣고 엔터를 쳤다는 걸 다시 관찰 가능.00:00:23 In [10]: 상태에서,hwp.Run("FileClose") 타이핑 후 엔터를 치니,예문모음.hwpx 파일이 닫히고, 화면에 빈 문서 1 만 보임. 00:00:30 In [11]: 상태에서,hwp.Quit() 타이핑 후 엔터를 치니,빈 문서 1 마저도 닫히고 우측 절반 화면에 바탕화면이 보임. (화면 좌측 절반은 파이참 화면) In [12]: 상태에서, 커서가 깜빡이다가 움짤 동영상이 끝남. ※ 강의 개선의견도 드립니다.초보자가 이번 챕터의 코드를 이해하려면 움짤 동영상의 도움이 크게 필요한데,동영상의 진행이 너무 빠르고 동영상 프레임 간 이동도 불가능해서 결국에는 동영상으로 녹화한 후에 천천히 돌려보기를 여러 번 해서 파악하였습니다.코드 자체의 난이도가 어려워서가 아니라 움짤 동영상을 천천히 단계적으로 보기가 어렵다는 이유로 인해,이 코드의 용도와 실제 어떻게 사용하는 것인지 이해하기가 매우 어려웠습니다.초보자를 위해 추후 강의 개선이 가능하시다면, 움짤 동영상을 훨씬 더 느리게 보여주시거나,움짤 동영상에서 어떤 행위들이 이루어지고 있는 것인지 흐름이라도 짚어주시면 좋을 거 같습니다. 거창한 설명을 말씀드린 게 아니라움짤 동영상이 뭘 보여주는 것인지의 핵심만이라도 텍스트로 추가해 주시면 매우 도움이 될 거 같아요.움짤에 대한 설명을 예를 들면,움짤에서는, hwp문서를 수동으로 미리 열어놓은 후, 해당 코드를 적용하기 전에는 hwp.Path 명령어가 정상작동되지 않는 모습을 확인할 수 있지만, 해당 코드를 적용한 후에는 hwp.Path 명령어를 실행하면 hwp 파일 경로가 정상적으로 출력되는 모습을 확인가능합니다.참고로, 움짤에서는 파이참에 IPython을 추가 설정한 환경에서 진행한 것입니다. cmd 창의 Python 콘솔로도 이 실습이 가능합니다 또는 불가합니다.요 정도의 설명 추가만으로도 초보자도 헤매지 않을 거 같습니다. 동영상을 정말 엄청 많이 돌려보고 나서야, 움짤에서 일코님이 하셨던 거 비슷하게 제 파이참에서도 진행하는 것을 성공하긴 했는데, 알고보면 너무 쉬운 난이도에 비해서 불필요하게 헤맸던 과정이었던 거 같습니다.왕초보여서 그런 점도 있겠지만, 핵심만 간단히 라도 짚어주시면 수강생의 이해에 매우 도움이 될 거 같아서요. 그럼 답변 부탁드릴게요. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의 문제 3 관련하여 문의드립니다.
해당문제에서 trian과 test에서 id값을 전처리 과정에서 삭제하였는데, 아래 사진처럼 향후 예측모델 생성 시에, id 값도 예측하기 위해서 삭제한거라고 생각하면 되는건가요?
-
미해결실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
docker환경의 gpu 사용에 대해 질문이 있습니다
안녕하세요 다니엘 선생님, 좋은 설명해주셔서 수업을 즐겁게 다 들을 수 있었습니다. 수업을 마치며, 한가지 궁금한 점이 있어 질문 드립니다. 도커를 배우기 전 윈도우 운영체제에서 CUDA와 tensorflow를 설치하는 데 고생했던 기억이 있습니다. 자신의 GPU에 맞는 그래픽 드라이버와 이에 호환되는 CUDA버전, cudnn 버전을 맞춰야 하는게 그 이유였는데, 도커에서 이미지로 빌드한 컨테이너 안에서 돌린 keras예제는 잘 실행되었습니다. pytorch도 마찬가지였습니다. 어떻게 따로 버전을 맞추지 않아도 자연스럽게 환경이 맞춰진건가요? VM에서 사용된 Tesla T4 gpu가 특이한건가요? 전공자가 아니라 질문이 황당하게 느껴지실 수도 있겠지만, 정말 궁금해서 여쭤봅니다!
-
해결됨[파이썬/Python] 문과생도 이해하는 DFS 알고리즘! - 입문편
다른 주제 강의
안녕하세요!! 먼저 좋은 강의 너무 감사드립니다 이해가 너무 잘돼요 ㅜㅜ전에 글중에서 올해 하반기에 다른주제 강의들도 올리실 계획 있다고 본 것 같은데 (DP, BFS 등등) 혹시 구체적인 일정 나온게 있나요? 나오면 꼭 결제하고 싶습니다! 감사합니다^-^
-
해결됨RAG 마스터: 기초부터 고급기법까지 (feat. LangChain)
수업자료 requirements.txt 파일은 어디에 있나요?
수업자료 requirements.txt 파일은 어디에 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 2강 데이터 불러오기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 데이터 불러오면 name 'pd' is not defined 라고 에러메세지가 뜨는데 뭐가 문제인가요?