묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.mode()에서 []의 의미
20:14초에서 df['원두'].mode() [0]에서[0] 의 의미가 무엇인가요? [] 안에 다른 숫자를 넣어도 되는가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩문의
ㅅ선생님 이전 8회 실기준비할 때 보면대부분 원-핫 인코딩으로 하는 분위기였는데이번에도 그렇게 준비해도 충분 하겠죠? 뭐랄까 Label Encoder는 실전에서 코드가 생각 잘 안나기도 하고 그래서요 ㅠㅠ 타겟값 옮겨겨놓기target = train.pop('total') # 원핫 인코딩 train = pd.get_dummies(train)test = pd.get_dummies(test) # 데이터 분할을 해보자 from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) # 랜포에 넣어보자 from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegresosr(random_state=0)rf.fit(X_tr, y_tr)pred = rf.predict(X_val) # 제출 해보자 pred = rf.predict(test)submit = pd.DataFrame({'pred': pred}) 이렇게만 해서 40점은 받긴 했는데... (저번에 1유형 0점맞아서 재수 중..ㅠㅠ) submit.to_csv("result.csv", Index=False)
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
섹션 7 데이터 가치와 미래
해당 동영상 재생이 되지 않는것 같습니다. 확인 부탁드려요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
15:54초 코드 설명창 문의
15:54초에서 해당 코드 설명이 나와 있는 것 같은데, 저는 설명창이 나오지 않는데 어떻게 하면 설명을 확인할 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.head()와 df 차이점 문의
df.head()와 df 입력시 차이점이 어떤것인가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 첫번째 문제풀이 및 실기대비
csv 파일을 주어졌으니,import pandas as pddf=pd.read_csv여기까지는 뜻도 모르고 기계적으로 따라하기는 했습니다. print(df)한 셀만 이용하라고 하셔서 내용도 궁금하니 확인할 겸 print문을 썼습니다. . f1 컬럼의 결측치를 중앙값으로 대체df.isnull().sum()을 통해 df에 결측치가 있다는 사실을 이해했는데,df['f1']=df['f1'].fillna()와 같은 형태로 채우기는 해야하는데.. 중앙값 (median 맞나요??) 코딩을 어떻게 응용해야 할 지 모르겠습니다. . 나머지 결측치가 있는 데이터(행) 모두 제거. 앞에서부터 70% 데이터 중 view 컬럼의 3사분위수에서 1사분위수를 뺀 값 계산 궁극적으로 첫번째 문제 때 부터 문제를 읽다가 난독(?) 증상이 와서어떤 코딩을 어떻게 적용 또는 응용해야 할 지를 몰라서 도무지 갈피가 잡히지 않습니다. 비슷한 고민이나 어려움을 겪어보셨던 분들 조언해주시면 좋겠습니다.필기합격 유효기간도 얼마 남지 않아서 실기를 꼭 따고싶어서 인터넷 동영상 강의를 들으며 따라해볼 때는 자신감이 붙는 것 같은데, 막상 모의문제 코딩 풀이를 하려니 마음만 앞서고 몸은 전혀 따라주지 않네요...그냥 처음 몇 번은 고민해봤자 생각이 안되니 코딩 방법이라도 외우든 요령을 틔워야만 할 수 밖에 없는지.. 정말로 갈피가 잡히지 않습니다.문제 읽고 이해를 못해서.. 문제를 읽고 적합한 코딩을 어떻게 응용해야 할 지 몰라 실기 0점만 주구장창 받으면 스트레스만 쌓이지 않겠습니까?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 1-2 gold값 가진 데이터 수
gold값을 가진 데이터 수를 구할 때 아래의 코드처럼 조건문 대신 .str과 .sum을 사용해도 괜찮은 건가요?print(df['f3'].str.contains('gold').sum())
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 시 표출 오류 및 컬럼수 불일치
아래와 같이, 수업에서 나온 코드 동일하게 작성했습니다.# 원핫 인코딩n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기display(c_train.head())c_train=pd.get_dummies(c_train[cols])c_test=pd.get_dummies(c_test[cols])display(c_train.head())그러나 원핫 인코딩에서 강의처럼 코드 표출이 안 됩니다. -> true , false로 표출됩니다. 또한, 컬럼 수도 99개로 1개 모자랍니다. 무엇이 오류일까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
기출 3회 작업 2유형에 원핫 인코딩을 하면 0/1로 변환이 되는 것이 아니라 True/False 로 변환이 되는데.. 이유가 뭘까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
중복값이 있는 데이터 생성 'car' 부분
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요계속해서 오류가 뜨는데 이유를 모르겠습니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
OneHotEncoder()와 get_dummies() 차이가 있는지요
OneHotEncoder()가 좀 더 쓰기 편한 것처럼 느껴지는, 빅분기 시험 준비에서는 get_dummies()를 사용하는 예가 더 많이 보이는 것 같습니다. get_dummies()를 더 많이 사용하는 이유가 어떻게 되는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제8 표출 이상
df.groupby(['city', 'f2']).sum() 위 코드를 실행하면 str으로 이루어진 열들의 값도 서로 합해져서 이상하게 표가 나옵니다.예로, id 열은 id100id60id000... 이런 식으로 한 행에 뭉쳐서 나와요. 아마 퇴근후딴짓님께서 쓰신 메서드가 depreciated되거나 update되서 발생한 문제인가 싶습니다..! 그래서 일일이 숫자열을 지정하는 코드를 실행해 봤는데요,df.groupby(['city', 'f2'])[['age', 'f1', 'f5', 'views']].sum()열 개수가 많을 때에는 번거로울 것 같습니다.. 해법이 없을까요?답변 미리 감사드립니다.좋은 강의 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장이 가능한지 여쭤보려고 합니다!
안녕하세요! 작년에 8회시험을 봤다가 작업형1에서 실수로 아쉽게 불합격하여서.. 이번 실기를 목표로 강의를 다시 듣고있습니다!! 오늘까지가 기간인데 혹시 9회차 시험때까지 한달이라도 연장이 가능할지 여쭤보려고 문의드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
17:22초 코드 오류
17:22초 강의 코드와 동일하게 입력햇는데, 오류가 발생합니다.원인을 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.['메뉴'] 입력시 시리즈 강의 화면과 다름
7:30초에 df.['메뉴'] 시리즈를 불러왔는데, 강의에서 처럼 시리즈로 보이지 않고, 데이터프레임으로 보입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 4 다른 풀이
문제 4다른 풀이 방식입니다. 아래 풀이방식도 유효한지 봐주시면 감사하겠습니다.print(sum(df.sum(axis=0)>3000))
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 합치기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 분리한 데이터 다시 합침에서 결과가(29304, 15), (3257, 15)로 나오는데요강의랑 달라서 뭐가 잘못된 건지 여쭤봅니다. train, test 합쳐서 인코딩 후 분리하기 결과가 (29304, 15) , (3257, 15)(29304, 99), (29304, 99)로 나오는데요강의랑 달라서 뭐가 잘못된 건지 여쭤봅니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원 핫 인코딩 질문
X_train과 X_test 데이터를 합친 후 원 핫 인코딩을 진행한 다음 다시 데이터를 분리하는 과정을 거쳤습니다. get_dummies 사용 시, 자동으로 범주형 데이터만 선택하여 원 핫 인코딩하고 전체 데이터를 반환한다고 들었는데원 핫 인코딩 후 데이터를 분리하여 각각 출력을 해봤는데, 기존에 있던 수치형 열들 (age, fnlwgt 등등) 다 사라지고 인코딩된 문자형 열들만 남아있더라구요.원래 원 핫 인코딩을 하면 수치형 열들은 다 사라지나요? X_train 데이터라 전체 열들이 다 있어야 될거같은데 인코딩된 문자열만 있어서 질문드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예측 후 평가관련하여
평가관련하여 질의 드리겠습니다.from sklearn.metrics import roc_auc_score roc_auc_score(y_val,y_pred[:,1]) roc_auc 등 다 평가할때y-val 와 값이 같은 인덱스에 딸려 와야 하는것이 아닌지요?같은 사람이 암인지 아닌지 예측을 하고 평가를 해야 하는데. 이건 자동으로 시스템에서 맞춰 지는건지요?제가 돌린 자료를 보고 출력을 하면 좀 다른거 같아서보통 분활 후 y_val 과 y_pred 데이터 정열 값이 어떤 순서로 이루어지는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
roc_auc
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요