묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출유형 작업형 1-2
풀이대로 푼다면 144가 나오는데 제곱대신 두번 적어서 풀면 143이 정답으로 나옵니다. 차이가 무엇일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pd.Timedelta() 에서 pd의 의미
pd.Timedelta() 이외에 여러 함수들을 보면 맨앞에 pd를 붙이던데, 이것이 의미하는 바가 무엇인가요? 단순 len()이나 sum() 같은 함수는 pd 안붙이고 사용하는데,pd를 붙이는 것과 안붙이는 것 구분을 어떻게 생각하면 편한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파라미터 의미
df = pd.read_csv('date.csv', usecols=[], parse_dates=[])처럼 usecols와 parse_dates를 파라미터라 호칭하시던데,어떤 것을 파라미터 라고 부르나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열 데이터 type 질문
dtype : datetime64[ns] 에서64랑 ns는 무엇을 의미하나요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 질문
강의에 알려주신대로 따라서 하고 있는데 원핫인코딩 결과에 income category랑 card category만 뜨고 나머지 object컬럼(gender 등)은 뜨질 않습니다.. 뭐가 문제인지 알려주실 수 있을까요? #baseline(object컬럼 제거) cols = train.select_dtypes(include='object').columns # print(train.shape, test.shape) # train = train.drop(cols, axis=1) # test = test.drop(cols,axis=1) # print(train.shape, test.shape) # 라벨인코딩 # from sklearn.preprocessing import LabelEncoder # for col in cols: # le = LabelEncoder() # train[col] = le.fit_transform(train[col]) # test[col] = le.transform(test[col]) # train.head() # onehot 인코딩 pd.get_dummies(train, columns=cols)마지막에 8101 rows × 39 columns 라고 뜨는데 그냥 표시만 안 된건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 스케일링
기출5회 작업형 2번 수치형 데이터 스케일링은 필요없나요? 언제 스케일링을 해야하는지 잘 모르겠어요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1번 모의문제 2 질문드립니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요소수점 나이를 제거할 때cond = df['age'] == round(df['age'],0) 이 코드로 반올림한 값과 age가 같은 것을 조건으로 걸었는데요 소수점 자리0.5미만인 애들은 제거가 안되지 않았을가요?예시:32 와 32.3 반올림한 값을 비교해도 같다고 나옴
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수 오적용 시 데이터 변경되었을 때, 원복 문의
변수 지정을 잘못 하여, 가격 프레임의 데이터가 완전 바뀌었는데다시 이전 데이터로 원복하려면 어떻게 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
퀴즈 1번 문의
min_price 변수 지정없이 바로df['이벤트가'].fillna(df['이벤트가'].min())로 사용하면 안되던데, 왜그런 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수별 ()와 [] 구분
함수별로 어떤것은 ()를 사용하고, 어떤것은 []를 사용하는데구분하는 법이 따로 있나요? 매번 헷갈리네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
알듯말듯하네요
앞에 띄어쓰기도 없고, 몇번을 해봐도 시즌 컬럼이 드랍이 안됩니다.. ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.mode()에서 []의 의미
20:14초에서 df['원두'].mode() [0]에서[0] 의 의미가 무엇인가요? [] 안에 다른 숫자를 넣어도 되는가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩문의
ㅅ선생님 이전 8회 실기준비할 때 보면대부분 원-핫 인코딩으로 하는 분위기였는데이번에도 그렇게 준비해도 충분 하겠죠? 뭐랄까 Label Encoder는 실전에서 코드가 생각 잘 안나기도 하고 그래서요 ㅠㅠ 타겟값 옮겨겨놓기target = train.pop('total') # 원핫 인코딩 train = pd.get_dummies(train)test = pd.get_dummies(test) # 데이터 분할을 해보자 from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) # 랜포에 넣어보자 from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegresosr(random_state=0)rf.fit(X_tr, y_tr)pred = rf.predict(X_val) # 제출 해보자 pred = rf.predict(test)submit = pd.DataFrame({'pred': pred}) 이렇게만 해서 40점은 받긴 했는데... (저번에 1유형 0점맞아서 재수 중..ㅠㅠ) submit.to_csv("result.csv", Index=False)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
15:54초 코드 설명창 문의
15:54초에서 해당 코드 설명이 나와 있는 것 같은데, 저는 설명창이 나오지 않는데 어떻게 하면 설명을 확인할 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.head()와 df 차이점 문의
df.head()와 df 입력시 차이점이 어떤것인가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 첫번째 문제풀이 및 실기대비
csv 파일을 주어졌으니,import pandas as pddf=pd.read_csv여기까지는 뜻도 모르고 기계적으로 따라하기는 했습니다. print(df)한 셀만 이용하라고 하셔서 내용도 궁금하니 확인할 겸 print문을 썼습니다. . f1 컬럼의 결측치를 중앙값으로 대체df.isnull().sum()을 통해 df에 결측치가 있다는 사실을 이해했는데,df['f1']=df['f1'].fillna()와 같은 형태로 채우기는 해야하는데.. 중앙값 (median 맞나요??) 코딩을 어떻게 응용해야 할 지 모르겠습니다. . 나머지 결측치가 있는 데이터(행) 모두 제거. 앞에서부터 70% 데이터 중 view 컬럼의 3사분위수에서 1사분위수를 뺀 값 계산 궁극적으로 첫번째 문제 때 부터 문제를 읽다가 난독(?) 증상이 와서어떤 코딩을 어떻게 적용 또는 응용해야 할 지를 몰라서 도무지 갈피가 잡히지 않습니다. 비슷한 고민이나 어려움을 겪어보셨던 분들 조언해주시면 좋겠습니다.필기합격 유효기간도 얼마 남지 않아서 실기를 꼭 따고싶어서 인터넷 동영상 강의를 들으며 따라해볼 때는 자신감이 붙는 것 같은데, 막상 모의문제 코딩 풀이를 하려니 마음만 앞서고 몸은 전혀 따라주지 않네요...그냥 처음 몇 번은 고민해봤자 생각이 안되니 코딩 방법이라도 외우든 요령을 틔워야만 할 수 밖에 없는지.. 정말로 갈피가 잡히지 않습니다.문제 읽고 이해를 못해서.. 문제를 읽고 적합한 코딩을 어떻게 응용해야 할 지 몰라 실기 0점만 주구장창 받으면 스트레스만 쌓이지 않겠습니까?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 1-2 gold값 가진 데이터 수
gold값을 가진 데이터 수를 구할 때 아래의 코드처럼 조건문 대신 .str과 .sum을 사용해도 괜찮은 건가요?print(df['f3'].str.contains('gold').sum())
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 시 표출 오류 및 컬럼수 불일치
아래와 같이, 수업에서 나온 코드 동일하게 작성했습니다.# 원핫 인코딩n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기display(c_train.head())c_train=pd.get_dummies(c_train[cols])c_test=pd.get_dummies(c_test[cols])display(c_train.head())그러나 원핫 인코딩에서 강의처럼 코드 표출이 안 됩니다. -> true , false로 표출됩니다. 또한, 컬럼 수도 99개로 1개 모자랍니다. 무엇이 오류일까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
기출 3회 작업 2유형에 원핫 인코딩을 하면 0/1로 변환이 되는 것이 아니라 True/False 로 변환이 되는데.. 이유가 뭘까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
중복값이 있는 데이터 생성 'car' 부분
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요계속해서 오류가 뜨는데 이유를 모르겠습니다 ㅜㅜ