묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨스파크 머신러닝 완벽 가이드 - Part 1
spark 추가 학습 관련 질문
선생님 안녕하세요?좋은 강의 진심으로 감사드립니다. 이전에 질문드렸을때 part2 는 나올 계획이 없다고 답변주셨는데요혹시 spark를 좀 더 심화해서 공부해보고 싶은데 추천해주실 만한 책이나 자료가 있으실까요? 원서도 상관이 없습니다.물론 spark best book top 10 이런식으로 구글링하면 추천도서가 나오긴 하지만.. 혹시 선생님께서 개인적으로 좀 좋은 교재라고 생각하셨던 도서나 자료가 있으신지 궁금합니다.
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
텍스톰으로 Bertopic을 사용할 수는 없나요?
이제 논문을 준비해야 하는데 최근에 Bertopic을 사용한 논문이 많이 보이더라구요. 혹시 텍스톰으로 Bertopic 방법을 사용할 수 있을까요? 만약 불가능하다면 파이썬에 대한 지식이 없는 초보자가 bertopic 방법을 사용하기는 힘들까요? 바쁘시겠지만 답변 부탁드립니다 감사합니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최빈값 채우기 관련 하여
데이터 전처리 강의 14:50 관련하여,X_train['workclass']의 최빈값과X_test['workclass']의 최빈값이 달라질 수 있는데train 데이터와 test 데이터를 서로 다른 최빈값으로 결측치를 채워도 되나요? 제 생각에는 train과 test를 합쳐서 최빈값을 찾고, 그값으로 결측치를 채워야 하지 않나 싶습니다.
-
해결됨ADsP 2주 합격 올인원 패스
기출문제 3과목-분류모델 모형평가 지표 2번 문제
23페이지에 있는 2번 문제입니다. F1 구하는 공식에 의하여, 기술해주신 답변은 아래 내용과 같습니다.=(2*0.33*0.3)/(0.3+0.33) = 6/19 그런데 해당 공식을 풀이하여 약분해보면 약 3.142857 입니다.=0.198/0.63 = 0.066/0.21 = 0.022/0.07 = 약 3.142857 보기에 있는 2번과 3번을 소수점으로 바꿔보면 두 개 값이 똑같습니다.② 18/57 = 0.315789③ 6/19 = 0.315789 정답이 왜 3번인지에 대한 구체적인 설명 부탁드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 시험장 - 개인키보드, 마우스 가능여부 질문
안녕하세요. 시험환경 관련해서 질문 하나 드릴께요. 시험장에서 개인키보드. 마우스 가능할까요? 바보같은 질문일지 모르지만.. 궁금해서요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의드립니다.
안녕하세요. 11월 말 실기 시험을 응시하기 위해 강의를 여러 번 돌려보고 있습니다.그런데 강의 기간이 11월 3일 만료가 되더라구요..연장 문의 드립니다! (이메일은 suho000904@gmail.com입니다.)감사합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시리즈 선택과 데이터프레임 선택이 강의와 다르게 나와요.
테이블형식으로 구성되는게 데이터프레임,그냥 숫자의 나열로 돼있는게 시리즈라서 이해하였는데시리즈 선택에서 나오는 결과물이 강의와 다르게데이터프레임의 결과물처럼 나오네요.뭐가 잘못된건지를 모르겠어요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[강의 교재 문의]
안녕하세요 강사님!강의를 이제 수강하려고하는데 실기 교재가 필수인지 궁금해서 문의남기게되었습니다.실기교재와 함께 병행하여서 수업을 진행하시는지 궁금합니다~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
설치된 파이썬 이용 가능 여부
검색이 영 안 나와서 여쭙니다.이미 VSCode 노트북 환경이 구축되어있는데 코랩 말고 이걸로 공부해도 되죠? (특정 패키지가 불러와지지 않는다든가 지원 함수가 달라졌다든가 하는 outdated 이슈가 잦은지 궁금합니다)3.12.6입니다.
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.강의에서는 Silhouette 이 부분이 1과 가까워지는 부분에서 좋은 n_cluster라고 하셨는데 그러면Elbow 차트 말고 Silhouette 만 써도 되는건가요?0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 4분 16초에 k.meanslabel==pardict를 하는 이유가 뭔가요? 라벨링 개수와 학습한 개수를 같은지 확인하는 이유가 궁금합니다.
-
미해결빅데이터 분석기사 시험 실기(Python)
10강 연습문제
1) X_train, X_test, y_train, y_test = train_test_split (df.iloc[:, 1:], df['survived'], test_size = 0.2, random_state = 42, stratify = df['survived'])로 되어야 하는거 아닌가요? 연습문제에서 df만 하셨는데, 그렇게 하면 이미 답이 변수에 포함되어있어서 정확도가 1로 나옵니다. 2) 전처리 다 하고나서 저 train_test_split를 수행해도 되나요? 전처리 할 때 X_train, X_test 두번씩 꼭 해줘야 하는게 번거롭고 실수가 날 것 같아서요.
-
미해결실무형 데이터 분석을 위한 핵심 SQL
DuckDB API 사용시 Connection Error가 발생합니다.
실습 코드를 순서대로 진행하니 아래와 같은 에러가 발생했습니다.*********************확인해보니 3번째 셀에서 duckdb를 연결하고%sql duckdb:///duckdb.db 그 아래에서 다음과 API로 연결을 시도하면 계속 에러가 발생합니다.duckdb_con = duckdb.connect("duckdb.db") **********************그래서 노트북 세션을 초기화하고 duckdb.db 파일을 삭제하고 3번째 셀을 실행하지 않고 duckdb API로 바로 연결하니 그때서야 제대로 연결되었습니다.
-
미해결빅데이터 분석기사 시험 실기(Python)
VotingClassifier Hard 사용
Hard VotingClassifier 을 사용하면 여러 모델이 내놓은 예측값 중에 가장 많이 득표 한 값을 최종 예측값으로 내놓는다는 것으로 이해하고 있는데요, 2개의 모델로만 했을 때, 두개의 모델이 다른 값을 낼 때는 어떤 값을 최종 예측값으로 내놓는 것인지2개의 모델로 하는게 의미가 있는것인지 궁금합니다. 제가 이해를 잘못하고 있다면 Hard VotingClassifier 에 대해서 조금만 더 설명해주시면 감사드리겠습니다.
-
미해결ADsP 2주 합격 올인원 패스
자료들이 2021년을 기준으로 작성되어 있습니다.
자료들이 2021년을 기준으로 작성되어 있습니다.2024년 최신본으로 업로드 해주실 수 있을지 문의차 글을 남겨봅니다. 그리고 교재자료가 페이지가 적어서요. 아니면 "국가공인 데이터 분석 준전문가 자격증 ADsP (비전공자도 배워서 바로 따는)" 책을 구매해야 하는 것으로 보이는데 맞는지 문의드립니다. 좀 더 이야기드리면수업 자료를 제공해 준다고 한 점이 있는데 , 수업 자료가 전체 책 제공이라고 생각하지는 않았으나, 제공해준 자료는 페이지가 너무 적고 내용이 없어서요. 유료로 구매한 만큼 자료가 많고 최신이라고 생각했는데, 강의가 2024년 7월 10일이 마지막 업데이트기는 하나 강의 게시일은 2021년이고, 어떤 강의를 최종본으로 업데이트 하셨는지는 잘 모르겠어서요. 전체 강의를 2024년 7월 10일에 다시 촬영하셔서 업로드 하신건지 문의드립니다. 만약에 별도의 수정 내용이나 추가 촬영이 없다고 한다면혹시 강의 업데이트는 추가로 계획이 있는지 문의드립니다.시험문제도 2021년과 다르게 동향이 바뀌었다고 해서요. 감사합니다.
-
미해결빅데이터 분석기사 시험 실기(Python)
구름IDE 실행 도움 요청
구름아이디에서 연습문제 실행하면 이런 오류가 뜨는데 도움 부탁드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
list형태를 불러올 수 없다고 합니다.
영상과 동일하게 적었는데 list 형태를 불러올 수 없다고 나오는 건 왜일까요??ㅠㅠ
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
load_metric 에러 발생
from datasets import load_metricImportError: cannot import name 'load_metric' from 'datasets' (/usr/local/lib/python3.10/dist-packages/datasets/__init__.py) datasets에서 load_metric을 불러오려고 하는데 위와 같은 에러가 발생합니다. 계속 삽질하고 있는데 방법을 찾기가 쉽지가 않네요ㅠ 도움 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요 작년 수강 후 불합격하여 올해 다시 재수강중에 있습니다.수강기간이 곧 만료되어서요 올해 시험까지 연장이 가능한지 문의드립니다.감사합니다!(이메일 주소 : yoonsk0121@naver.com)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요. 11월 말 실기 시험을 응시하기 위해 강의를 여러 번 돌려보고 있습니다. 그런데 강의 기간이 9월 19일 만료가 되더라구요.. 연장 문의 드립니다! (이메일은 sj452@naver.com입니다.) 감사합니다.
-
해결됨확률과 통계 101
피셔의 z변환 질문
피셔의 z변환은 어떻게 해서 나온것인가요? 어떻게 해서 저런 식이 나왔죠?그리고 정규분포를 따른다는게 정확히 따른다는 말인가요(식도 동일한 형태) 아니면 정규분포의 형태를 따른다는 것인가요? (평균에 대해 빈도수가 높고 평균을 기준으로 멀어질 수록 빈도가 줄어들며 대략적으로 대칭인 정규분포와 비슷한 형태)