묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글- 작업형3 updated 2023.11에서 독립성 검정 문제
Chi2ContingencyResult(statistic=5.929494712103407, pvalue=0.01488951060599475, dof=1, expected_freq=array([[115., 115.], [185., 185.]]))다음과 같이 결과가 나오는데, 여기서 expected_freq=array(남자의 합격 기대빈도(115), 남자의 불합격 기대빈도(115), 여자의 합격 기대빈도(185), 여자의 불합격 기대빈도(185))이 순서가 맞나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 강의 6:35초 문의
안녕하세요! 대응표본검정 강의 6:35초 부분에서윌콕슨 검정 alternative를 대립가설 기준으로 봐야한다고 말씀하신 이유가,샤피로-윌크 검정에서 대립가설을 따른다고 결론이 났기 때문인가요? 감사합니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
FileZilla 권한 거부
강사님하신대로 빠른연결하면 home/bigdata가 아닌 /로 들어가지고 home을 눌러서 bigdata로 들어가려해도 권한 수정되어있는데 제가 뭔가 빠뜨린건가요?bigdata 권한 수정해주면 될 것 같긴한데 추후에 문제가 생길까봐 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다. 어떻게 해야 하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
노트북&데이터 자료 일괄 다운로드 방법 문의
안녕하세요 🙂 수업자료 ipynb와 data파일을 일괄적으로 다운받을 수 있는 방법이 있을까요? 확인 부탁드립니다!
-
미해결빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
LDAvis 시각화가 안됩니다.
사진과 같이 오류가 계속 뜹니다... 어떻게 하면 좋을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선언문에 대한 질문
수업을 듣다보면 함수나 모델이나 이런것들을 가져올때 nump, sklearn, sklearn.preprocessing 등...그리고 import 해오는 것들이 어디에 속해있는 것인지? 이런 것들이 외우려니 좀 많이 혼동이 되서 잘 안외어져서 질문드립니다. 시험장에서 좀더 효율적으로 잘 기억나게 하는 방법이 있는지요?아니면 나올때 마다 다 외워야하는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼 선택
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 둘 중 어느방법을 써도 무방할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요실제 시험장에서 검증단계가 꼭 필요한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 작업형 3유형 카이제곱 검정 List 값 문의
ob = df.value_counts(normalize=True).sort_index() ob = ob.to_list() ex = [0.1, 0.05, 0.15, 0.7]즉, 관찰값과 기댓값을 비율로 입력하여관찰값 [0.2, 0.15, 0.1, 0.55]기댓값 [0.1, 0.05, 0.15, 0.7] 으로 비교하면 안되나요?비율은 같은데 통계량과 P-value 가 다르게 나오네요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원핫인코딩 하니 0,1이 아닌 True, False로 결과가 나왔습니다.수치결과가 다르지는 않았어서 큰 문제는 아닌것같은데, 0,1,로 나타낼 방법은 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LinearRegression, LogisticRegression 쓸 때
/usr/local/lib/python3.10/dist-packages/sklearn/linear_model/_logistic.py:458: ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED LIMIT. Increase the number of iterations (max_iter) or scale the data as shown in: https://scikit-learn.org/stable/modules/preprocessing.html Please also refer to the documentation for alternative solver options: https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression n_iter_i = checkoptimize_result( 계속 이 문구가 뜨는데, 문제가 있는 걸까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문이 있습니다~~
기출2회를 풀고 있는데요주어진 데이터셋(members.csv)의 앞에서부터 순서대로 80% 데이터만 활용해 'f1'컬럼 결측치를 중앙값으로 채우기 전 후의 표준편차를 구하고, 두 표준편차 차이 계산하기 (단, 표본표준편차 기준, 두 표준편차 차이는 절대값으로 계산) 이 문제를 시험환경에서 풀면len(df)*0.8 df = df.iloc[:80] df before = df['f1'].std() median1 = df['f1'].median() # 20.574853076621935 import numpy as np df['f1'] = df['f1'].fillna(median1) after = df['f1'].std() # 17.010788646613268 이게 한 창 안에서 한번에 코딩이 되면서before과 after 둘다에 17.010 어쩌고가 들어가서print(before-after) 을 하면 0이 되더라고요 실행은 한 코딩창 안에서 진행해야 하는데그럼 숫자를 따로 저장해서 20.574 - 17.010 을 출력해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2 유형 평가 방식
안녕하세요첫 실기 준비이다 보니 궁금한게 너무 많네요 ㅠㅠ 2유형 평가는 순수하게 제출된 csv 파일로만 평가되나요?아니면 풀이한 코드까지 평가 대상인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형2] 머신러닝 및 평가지표-모델링 및 평가(회귀)
안녕하세요, [작업형2] 머신러닝 및 평가지표-모델링 및 평가(회귀) 강의에서결과값을 예측하는거에 대해 회귀분석이니 y값을 예측하는거고.. 이 하나의 값은 무엇을 의미하나요 ??평가방식이 RMSE이니 charges의 평균의 루트를 씌운값일까요 ??
-
미해결빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
강의 자료
안녕하세요. 강의 때 들었던 내용을 자료를 보면서 빠르게 복습하고 싶은데 자료를 어디서 받을 수 있는지 모르겠습니다. 혹시 따로 올려주신 자료가 없다면 강의자료 및 사용되는 프롬프트(및 코드) 업로드 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨 인코딩 질문 드립니다.
안녕하세요라벨인코딩 질문드립니다. 피처 엔지니어링 > 라벨인코딩 강의 부분 중에LabelEncoder 를 le 라는 변수에 선언하고,이후에 반복문 안에서 한 번 더 le 라는 변수에 encoder 를 다시 할당(?) 해주는데 뭔가 초기화(?) 같은 역할을 해줘야하는건가요?아니면 반복문 안에 le = encoder() 부분은 생략해도 무방한가요? le = LabelEncoder() for col in cols: le = LabelEncoder() # 이 부분이 꼭 들어가야하나요? X_train[col] = encoder.fit_transform(X_train[col]) X_test[col] = encoder.transform(X_test[col])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
성능평가 이해가 안되는 부분이 있습니다!
다른분들이 질문남긴거에 답변 달아주신걸 봐도 아직 이해가 안되는 부분이 있습니다.<작업형2 모의문제 3 수업노트 중> y_test 파일의 최종 결과파일의 데이터는 0 아니면 1인 이진분류인데,predict_proba로 제출한 값은 확률값인데,이 부분 확률로 제출하는게 괜찮다고 설명해 주신 부분을 보았는데도 아직 명확하게 이해가 되지 않습니다. 이 성능평가에 대한 부분을 어떻게 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글에서 문제 풀어본후 저장안되게 하는 방법
캐글에서 문제 풀어본후 저장안되게 하는 방법이 있나요?다시 풀어보고 싶은데 한번 실행한 코드는 저장되서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보계속 맞게 적었는데 안되는데 머가 오류일까요?