묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
LDA 분석시 빈출 키워드 관련 질문드립니다.
안녕하세요 선생님LDA분석을 마치고 자료를 정리하는 중인데 빈출 키워드 관련 궁금한 점이 있어 질문 드립니다.LDA분석시 파이썬 코드에서 상위 10개 혹은 15개 빈출단어를 설정하고 실행하면 해당 단어와 가중치가 함께 출력이 됩니다.그리고 PyLDAvis 라이브러리로 시각화를 하면 오른쪽 단어 그래프 맨 상단에 Relevance 값을 조정하여 전체에서 빈출된 단어 혹은 특정 토픽에서만 빈출하는 단어의 목록을 변경해 가며 확인할 수 있는데궁금한 점은이때 상위 10개 혹은 15개 빈출 단어와 그래프에서 Relevance 값을 조정한 단어가 다르게 나오는데.. 둘 중 연구자가 판단해서 연구에 사용하기 적합한 것으로 사용해도 되는 걸까요?또 Relevance 값은 가중치 값이 표시되지 않는데 표시할 수 있는 방법(코드)이 있는지, 논문에서 표로 단어 내용을 제시할 때 어떻게 제시하면 좋을지 궁금해서 질문 드립니다.바쁘시겠지만 관련해서 답변 주시면 정말 감사하겠습니다!
-
미해결Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기
자바 환경설정 PATH 연결
안녕하세요. 수업 잘 듣고 있습니다.이 영상 4분에 자바 PATH 설정 하는 부분에 /usr/lib/jvm/jdk1.8.0_271 이 폴더 안에 /etc/environment 가 없어서 vi 혹은 vim 이 적용되지 않습니다. 버전이 업그레이드 된것인가요? 아니면 제가 잘못한 것 인가요? 혹은 환경 변수 설정할 수 있는 다른 방법이 있을까요?
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4
상관/회귀 방정식의 상관계수 및 수정된 상관계수 공식 문의
안녕하세요? 잘 듣고 있는 수강생입니다. 상관관계 관련하여 2차 회귀식에 대한 상관계수 및 수정된 상관계수 공식을 알려 주실수 있으신지요? 2차회귀식을 이용하여 분산분석표 작성 후, SSR/SST로 계산한 값이 결정계수로 보면 될런지요?
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
통합자료 송부좀 부탁드립니다 .
alsdl118@naver.com 여기로 보내주시면 감사드립니다 .
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번에 불합격했는데요 ㅠㅠ
올해 말에 다시 보려는데 10월초면 강의가 끝나더라고요ㅜㅜ불합격했는데 수강연장은 안될까요?11월말이 시험인데 ㅠ
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
강의에서 사용하는 csv 파일이 없습니다
0301 KLUE Dacon 데이터셋 소개, 텍스트 길이 분석강의에서 다루는 'topic_dict' csv 파일이 없습니다. 어디서 파일을 구할 수 있나요??
-
미해결15일간의 빅데이터 파일럿 프로젝트
듣고있는 와중에 질문있습니다.
이 과정은 가이드 주시는데로 모든 프로그램을 다운받고 같이 따라해야 이수되는 교육인가요? 자바 다운로드에 들어가도 알려주신 버젼 대비 훨씬 더 업데이트 된 버전만 가능한 것 같네요. 꼭 정확하게 일치된 버젼을 설치해야 하는지요?
-
미해결빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
LDAvis 시각화가 되지 않습니다.
안녕하세요 선생님, 수업 잘 듣고 있습니다. 파이썬 기본 용어 하나도 모르는데 선생님꺼 강의 보면서 하나씩 따라가고 있습니다. 다름이 아니라 저도 LDAvis 시각화가 되지 않는데요, 오류 코드는 다음과 같습니다. +AI 답변 참고해서 업그레이드 했는데도 여전히 오류라고 뜹니다.ict'방법 알려주시면 감사하겠습니다! /usr/local/lib/python3.10/dist-packages/ipykernel/ipkernel.py:283: DeprecationWarning: `should_run_async` will not call `transform_cell` automatically in the future. Please pass the result to `transformed_cell` argument and any exception that happen during thetransform in `preprocessing_exc_tuple` in IPython 7.17 and above. and should_run_async(code) Requirement already satisfied: pandas in /usr/local/lib/python3.10/dist-packages (2.2.2) Requirement already satisfied: numpy>=1.22.4 in /usr/local/lib/python3.10/dist-packages (from pandas) (1.26.4) Requirement already satisfied: python-dateutil>=2.8.2 in /usr/local/lib/python3.10/dist-packages (from pandas) (2.8.2) Requirement already satisfied: pytz>=2020.1 in /usr/local/lib/python3.10/dist-packages (from pandas) (2023.4) Requirement already satisfied: tzdata>=2022.7 in /usr/local/lib/python3.10/dist-packages (from pandas) (2024.1) Requirement already satisfied: six>=1.5 in /usr/local/lib/python3.10/dist-packages (from python-dateutil>=2.8.2->pandas) (1.16.0) --------------------------------------------------------------------------- TypeError Traceback (most recent call last) /usr/local/lib/python3.10/dist-packages/IPython/core/formatters.py in __call__(self, obj) 339 pass 340 else: --> 341 return printer(obj) 342 # Finally look for special method names 343 method = get_real_method(obj, self.print_method) 4 frames/usr/local/lib/python3.10/dist-packages/pandas/core/frame.py in to_dict(self, orient, into, index) 1986 >>> df['C'] = pd.date_range('2000', periods=2) 1987 >>> df.to_numpy() -> 1988 array([[1, 3.0, Timestamp('2000-01-01 00:00:00')], 1989 [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object) 1990 """ TypeError: to_dict() takes from 1 to 2 positional arguments but 4 were given
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
비전공자 직장 병행 합격했습니다.
비전공자(심지어 법학 전공입니다)에 직장 병행하면서 시험 준비했는데,강의 듣고 한번에 합격할 수 있었습니다. 강의가 체계적으로 잘 구성되어 있어서정말 도움이 많이 되었습니다. 시험 전날 늦은 시간에 질문 올렸는데도 친절하게 답변해주셔서 감사합니다.답안 제출 못할 뻔 했는데 빠르게 답변해주셔서 숙지하고 답안 잘 제출할 수 있었습니다 ㅎㅎ;
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기분좋은 실기 합격입니다.
기분좋은 실기 합격인데 혹시 점수가 변동될 수가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
(문의) 불합격해서 시험전 1~2달 전에 재수강하고 싶은데요.
유형2에서 전처리 전에 나머지(스탠다드스켈러, 트레인_테스트, 랜포만) 하고 돌렸을때 에러 떨어져서...긴장해서 시간보내다가...(라벨인코딩이나 겟더미 를 했어햐 하는데... )범주3개를 그냥 지워는 형태로 하고.랜포하고 400대의 평가점수... 그랬더니....유형2의 점수가 10점 주네요..나머지1,3도 모르는 문제+센스부족(오즈비5배)+문제이해부족(유의한 것 쓴 부분도 꺼꾸로 쓴 듯하고요)각각 틀려버려서 불합격했습니다만...궁금한점은...전에 1년짜리로 했는데... 1달 단위로 수강하는게 가능한 것 처럼 보이는데....가능한지요 ?그리고 기출에서 풀이는 있는데...빈노트형태가 없는 것도 있는데,... 이부분도 만들어져 있었으면 좋겠습니다.그리고 별도 최종 모의고사도 1~2개 추가 되었으면 참 좋겠습니다.. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제8회 실기 합격
비전공자 이공계 출신으로 직장 다니면서 올해 초시로 필기 준비해서 합격하고 실기 준비하다가, 실기 시험 6일 앞두고 제3유형에서 현타가 와서;; 웹서핑하다가 이 강좌를 발견했습니다. 6/16(일)에 결제하고 정말 열심히 퇴근후 (Python으로) 딴짓을 했습니다. 오늘 사전점수 확인을 했는데(시험장 나와서 제3유형에서 반올림 실수가 생각남;;) 95점(제1유형 30, 제2유형 40, 제3유형 25)으로 합격이네요. 정말 이 강의 덕분입니다. 큰 도움을 받았습니다. 고맙습니다~! *^^*p.s. 제2유형에서 평가지표 MAE가 40.xxx가 나왔는데, 승차인원이 타겟이여서 답 제출시 예측값을 int를 적용해서 제출했습니다(정수로 변경시 MAE는 40으로 내려감). 정수로 굳이 변경할 필요는 없었겠지만 평가지표가 개선되기에 정수형으로 제출했습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅데이터분석기사 합격이요! 좋은 강의 감사합니다.
덕분에 실기 잘 준비할 수 있었습니다. 감사합니다 ^^ 잘 배웠습니다 ㅎㅎ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번은 LinearReggression으로는 풀 수 없는건가요?
randomforest로도 해보고 Linear으로도 했는데 최종 제출은 Linear로 제출 했더니 10점이 나왔네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사 합격
비전공자인데, 강사님의 강의를 듣고 한 번에 붙을 수 있었습니다!시험 전까지 강의 문제와 캐글 문제까지 여러 번 복습했고, 그 결과 좋은 점수를 받을 수 있었던 것 같습니다.감사합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 95점 합격 감사합니다
8회 첫실기 합격했습니다.비 전공자 직장인이라 걱정했는데다행히 한방에 붙었네요 ㅠㅠ 3유형 오즈비 *5 문제를 틀린것 같네요. 캐글 문제는 여유가 없어서 거의 못풀어봤고강의 쭉 보고 잘 안되는 3유형과 1유형 위주로 복습했습니다.마지막에 정리해서 올려주신 2유형 같은 방법으로 풀기, 마인드맵이 많은 도움이 됐습니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 8회차 시험질문있습니다.
제가 mae제출인지 모르고 mse로 제출해서 냈는데 크게 상관이 없을까요 ?ㅠㅠ
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
적합한 알고리즘이나 라이브러리를 알고싶습니다
안녕하세요제가 구현하고 싶은 내용은 업체명(상호)에서 특정한 문자열 포함여부에 따라 20가지로 분류하고자 합니다제 소견에 로지스틱 회귀 + softmax + 크로스 엔트로피로 하는 것이 효율적인 것 같은데 적용에 적합한 머신러닝 라이브러리나 알고리즘을 알고 싶고 더불어 관련 자료 또는 사례의 출처도 알려주시면 너무 감사하겠습니다
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
통합강의 자료 부탁드립니다.
해당 강의 자료 통합본 자료 공유 부탁드리겠습니다.아래 메일주소로 보내주시면 감사하겠습니다.943421292@naver.com
-
미해결15일간의 빅데이터 파일럿 프로젝트
회귀분석 관련 질문 드립니다.
R을 이용한 회귀분석 강의에서 smartcarMaster2Income에 있는 capacity를 feature로 income이라는 lable을 예측하는 것으로 이해했는데 분석에 사용된 데이터를 통해 얻은 모델을 검증하는 과정에서 Test파일을 가지고 predict를 하고나서 동일한 파일과 비교를 하는게 잘 이해가 되지 않아서 질문 드립니다. 모델을 검증?추론?할때는 lable값이 없는 데이터를 넣고 그 결과가 실제데이터(test파일)과 얼마나 가까운지를 확인하는 것이 아닌가요?