묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 실기 유형
선생님 안녕하세요!현재 작업형 1~3유형이 있는데 세 유형 모두 이번 시험에 나오는 것 맞나요? 전에 빅분기 실기 유형?이 약간 변형되었다는 말을 들었어서요. 선생님께서 강의에 다뤄주신 유형만 공부해도 되는 것 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
구글폼말고 다른 버전있나요?
회사에서 연습하고 싶은데 구글폼은 보완문제로 안열려서요,, 혹시 다른 버전은 없나요 ??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이 두가지 방법의 코딩 결과값이 왜 다른가요??!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이거 캐글에 있는 T1-9 번 문제입니다.첫번째 방식은 f5 컬럼의 평균값과 중앙값을 각각 구해 직접 계산하여 구하였고, 두번째 방식은 모범답안과 같은 방식으로 sklearn의 스케일링 방식으로 문제를 풀이했습니다.두 결과가 같게 나와야 한다고 생각하는데 값이 약간의 차이이지만 다르게 나오네요...! 제가 어떤 부분을 놓치고 있는 걸까요? 알려주시면 감사하겠습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1, MAE 등...
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요시험이 처음인지라 질문드려봐요! 😋 필기에 나왔던 개념들이지만.. 실기에서 해보려니까 기억이 안나는데요..ㅎㅎ 시험장에서는 f1, MAE 등 평가 지표들을 어떻게 구하는지 식이 나와있나요..? 암기해가야할까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train data와 test데이터 분리할때 트레인데이터의 쉐입을 이용한다는 말과 라인을 사용한다는 뜻이 뭐에요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 6 모의고사 풀이 관련 문의
선생님 안녕하세요!강의에서 복사하라고 하신 코드 부분들은 시험볼 때 제가 직접 타이핑을 해야하는 건지, 이미 작성되어있는것인지 궁금합니다!(아래 코드)# 시험환경 세팅 import pandas as pd from sklearn import datasets dataset = datasets.load_wine() df = pd.DataFrame(dataset['data'], columns=dataset['feature_names']) df['target'] = dataset['target'] df.to_csv("data1-1.csv", index=False) ##################################################################### # 출력을 원할 경우 print() 함수 활용 # 예시) print(df.head()) # getcwd(), chdir() 등 작업 폴더 설정 불필요 # 파일 경로 상 내부 드라이브 경로(C: 등) 접근 불가 # 데이터 파일 읽기 예제 import pandas as pd a = pd.read_csv("data1-1.csv") # 사용자 코딩 # 답안 제출 예시 # print(평균변수값)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rf.predict와 rf.predict_proba 차이
rf.predict와 rf.predict_proba 차이어떨때는 predict만 쓰시고 어떨때는 predict_proba를 쓰시던데어떤 차이가 있고 뭘 써야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 (이진/다중 분류, 회귀) 🆕 updated 2023.10 _ 첨부자료
안녕하세요?선생님, '평가지표 (이진/다중 분류, 회귀) 🆕 updated 2023.10' 강의의 첨부 자료 다운이 안돼서 문의 드립니다.하단의 첨부자료 클릭을 해도 다운이 안돼서 질문드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 선생님, 질문은 3가지 입니다. 1) 저는 문제를 딱 접했을때 분류모형을 써야할지, 예측모형을 써야할지 판가름을 정확하게 못하는 것 같습니다. 쉽게 판별하는 방법이 있을까요? 2) 이 문제의 경우 target인 output 컬럼을 train.head() 로 보면 0과 1로 구분되어있어서, 0 또는 1로 분류하는(분류모형) 것인가 생각했다가도 문제 맨위에서 참조해주는 예시에서 id,output 41,0.633 28,0.123 222,0.355를 보면 output이 확률값으로 되어있어서 회귀모형을 사용해야하는 것인가? 라고 헷갈리곤합니다. 어디서 개념을 잡지 못하는 것일까요 3) 최종 예측을 할때pd.DataFrame({'id':test_id, 'output':pred_proba[:,1]}).to_csv("00000.csv", index=False)output에 pred_proba 를 쓰셨는데 참조예시에서 확률값을 OUTPUT에 담았기 때문에 pred_proba를 사용한 것일까요?그렇다면 output에 pred 를 담는 경우는 어떤 경우인지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의문제 3번 3개의 파일로 풀었을 때
안녕하세요, 선생님!작업형 2 모의문제 3번을 풀고 있는데 강의에서 2개의 파일이 있는것으로 공부한 후 3개의 파일이 있는 것으로 혼자 풀어봤는데요. 첫번째 사진처럼 warning이 나오는 것 이외에는 마지막에 테스트도 90. ... 으로 나오고 에러사항이 없었는데 그럼 된것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
dir/help/__all__ 사용법
sklearn 설명해주실때 dir/help/__all__ 사용법 알렺쉰거같은데 혹시 어느 강의인지 알수있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-9 질문
쌤 안녕하세요! 항상 빠른 답변 감사드립니다.날숨에 재력 들숨에 건강 얻으세요.. 캐글 T1-9 문제 풀다가 궁금한 점이 있어 문의드립니다표준화해서 scaler = StandardScaler()까지는 이해를 했는데요.fit 시키는 과정에서 왜 df['f5']가 아닌 df[['f5']] 이렇게 괄호가 두번 나오는 건가요? ㅠ하나로 묶는거면 [df['f5']]도 아니고 왜 괄호가 두번 나오는지.. 잘 모르겠어요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링할 때 리턴되는 데이터 타입 질문 드려요.
스케일링할 때 아래처럼 컬럼을 넣을 때와 그렇지 않을 때가 리턴 타입이 다르네요.넣으면 DataFrame 타입이 리턴되고, 아니면 ndarray 타입이 리턴 되던데요..꼭 컬럼을 붙여줘야 DataFrame이 리턴되나요?n_test[cols] = scaler.transform(n_test[cols]) n_test = scaler.transform(n_test) c_train = pd.get_dummies(c_train) 결과랑 concat할 때 오류가 발생해서 여쭤 봅니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가부분에서 rmse(y_test['charges'], pred)를 썼는데
수험자는 알 수 없는 영역이긴 하지만 pred부분에 np.exp(pred)로 넣어야 정확한 평가가 되는게 아닐까요? 17000이 넘는 너무 터무니없는 값이 나와 생각해보니 로그 스케일을 제거해야 정확한 값이 나오지 않는가 싶어서요. np.exp(pred)로 평가를 해보니 4686 정도로 양호한 결과가 나오는 거 같아 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀에 sklearn과 statsmodels 두가지가 있던데, 언제 어떤걸 써야 할까요?
안녕하세요.로지스틱 회귀에 아래의 두가지 모듈이 있던데, 변수의 계수값은 두 모듈 모두 사용이 가능하다고 하셨는데 sklearn 모듈에선 어떻게 변수의 계수값을 보나요?(작업형3 부분을 계속 보다가 작업형2에 로지스틱 회기 모델 사용 부분을 보니 또 다 까먹었네요.. ㅠㅠ)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이원분산분석
이원분산분석 진행시 데이터가 정규성을 만족하지 않으면 분석이 불가능 한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 질문 드립니다.
안녕하세요, 수강생입니다. 선생님 노트북 작업형2 문제 중 type2-ex의 백화점 구매 데이터를 활용한 문제와 type2-2nd의 2회 기출 문제 풀이를 보다가 궁금한 점이 생겨서 이렇게 문의글 남깁니다. 두 문제 모두 X_train, X_test, y_train 이렇게 3개의 데이터셋이 주어졌는데 전체 풀이에서는 검증데이터 분리하는 train_test_split에서만 각각의 X_train, y_train['target'] 값만 활용해서 풀이한 것으로 이해했습니다. 하지만 type2-2nd 2회 기출에서는 중간 풀이 과정에 X_train, y_train을 concat으로 합쳐서 중간에 설명을 하셨더라구요~ 물론 풀이에서는 concat으로 합친 데이터를 활용해서 작업된 것 같지는 않은데 혹시 train 데이터 합치는 과정이 반드시 필요한가요? 작업형2 기출 문제들을 학습하면서 데이터셋이 train과 test로 주어질 때와 X_train, X_test, y_train 이렇게 3개가 주어질 때 검증 데이터 분리하는 train_test_split에서만 구분해서 풀이하면 될 것 같은데요. 제가 혹시나 놓치고 있는 부분이 없는지 조언해주시면 감사하겠습니다!!!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 관련 질문입니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 작업형1 모의문제1 강의에서 문제2번 중 '해당 컬럼에 결측치가 있는 데이터(행)를 삭제 함' 문장에 대해 질문입니다. df = df.dropna(subset=['f1'])이 답인데,왜 df[‘f1’] = df[‘f1’].dropna() 는 불가능한지 궁금합니다. ㅠㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이진분류 target값에 문자
선생님 혹시 이진분류는 타겟값이 숫자일수도 있고 문자일수도 있는 건데 만약 문자일 경우는 학습을 시키기 전에 반드시 숫자로 인코딩이나 replace변경을 하지 않고 실행해도 되는지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object명의 컬럼 없애버리는 코드 실행
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요5-1 작업형2 모의문제 7:26 에서안녕하세요. object명의 컬럼 아예 없애버리는 방법으로4-2 작업형1 모의문제 4번에서 풀었던 방식처럼코드를 이렇게 실행하면 안되는걸까요?# object명의 컬럼을 아예 없애버리기 cols = train.select_dtypes(exclude = 'object').columns cols train = train[cols] train.head()