인프런 영문 브랜드 로고
인프런 영문 브랜드 로고
데이터 사이언스

/

데이터 분석

빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)

파이썬과 ChatGPT를 활용한 텍스트마이닝 분석 기법,빅데이터 분석 기법, 단어빈도분석,워드클라우드 시각화, 형태소분석,토픽모델링 분석 기법을 배우며, 논문 작성 시 필요한 텍스트마이닝 데이터 분석 기법 활용법, 연구논문 작성법에 관한 강의입니다.

(4.3) 수강평 6개

수강생 108명

Thumbnail

초급자를 위해 준비한
[데이터 분석] 강의입니다.

이런 걸
배워요!

  • 파이썬을 활용한 텍스트마이닝 핵심 비법 요약

  • 단어빈도분석

  • 워드클라우드 시각화

  • 형태소 분석

  • 텍스트에서 중요도를 파악할수 있는 TF-IDF

  • LDA기법을 활용한 텍스트 토픽 분류

  • 빅데이터/텍스트마이닝 논문 작성시 데이터 해석법

  • 텍스트마이닝의 핵심 이론 설명

  • KNU감성 사전을 활용한 감성분석 (감성어휘추출,감성문서비율)

텍스트마이닝 혹은 텍스트마이닝 관련논문 작성에
고민이 있으신 분들을 환영합니다! 🙌

 

수강 전 무료 강의인 "기초 텍스트마이닝: 앱 리뷰 분석 with 파이썬""텍스톰 TEXTOM 기초 강의: 빅데이터 논문 작성을 위한 SNS 인식 분석" 강의를 들으시면 이해하기가 쉽습니다.

 

고전모델인 LDA토픽모델링,KNU 감성분석부터 최신기법인 BERTopic까지 텍스트마이닝/빅데이터 분석 논문에 쓰이는 핵심 기법들을 활용해 논문 작성 하실수 있도록 안내한 강의입니다.

 

 

본 강의는 인문,예체능, 보건 의료 등의 인문사회계열 대학원생,연구자분들이 빅데이터 논문 작성하실 때 도움을 드릴 수 있는 강의입니다.

 

 

비전공자,문과생 분들은 이 강의를 통해 텍스트마이닝 논문 작성에 대한 두려움과 막막함을 없앨 수 있습니다!

 

ChatGPT를 활용하여 빅데이터/텍스트마이닝 분석을 쉽게 할수 있는 방법 노하우도 강의에 담아냈습니다. 

 

 

"30시간에 배울 수 있는 내용들을 4시간에 핵심만 압축해 놓았습니다!"

 

 

 "📖초심자 분께서는 빅데이터 논문/텍스트 분석 하느라 여러시간 헤매실 필요가 없습니다."

 

 

"📖텍스트마이닝 논문만 1저자로 10편 이상 쓴 연구자의 방법을 압축해놓은 핵심 강의입니다"

 

 

"간결하지만 깊이 있는 학습을 원하시는 분을 위한 강의"

 

 

 

 

 

📚복잡한 이론과 장황하고 원론적인 이론 설명 강의가 아닙니다.

 

LDA모델에 사용된 수학이론

 

🗝 전공자들 수준의 원론적인 이론 설명을 하는것이 아니라 실무나 빅데이터 논문을 쓰시는 분들이 바로 활용이 가능한 실용적 강의 입니다

 

논문이나 실무에서 주로 사용되는 LDA모델 시각화결과

 

 

최근에 많이 등장하는 BERTopic 모델 활용법도 안내합니다.

 

 

 

🗝 강의를 듣고 사용된 코드만 변형하신다면 텍스트 분석을 적용할 수 있게끔 하였습니다.(입력데이터만 바꾸면 데이터 분석이 가능한 코드 제공)

 

  •  

 

📚6년 간 텍스트 분석 실문 및 연구 경험, 그 핵심만 압축한 강의입니다.

 

안녕하세요 저는 AI개발을 하고 있는 이진규입니다.

 

강의를 오픈하게 된 저의 스트리를 간단히 말씀드리고자 하는데요.

 

저는 전 직장에서 인문사회학적인 연구를 하다 우연히 텍스트마이닝 프로젝트를 시작하였습니다. 

 

처음엔 정말 많은 시행착오를 겪었습니다. 아무리 해도 결과값이 이상한데... 

 

무슨 기법, 어떤 언어 모델을 써야 하지?? 등등 정말 막막했습니다.

 

기법들을 적용해도 원하는 결과와 다르게 나오는 걸 보며 많은 한숨을 쉬었지만

 

결국, 분석모델과 데이터를 여러번 돌려보며  몇날을 고민 끝에 해결 하였습니다. 

 

이후 몇 년간 여러 프로젝트를 거치며 실력이 쌓이면서 인프런 강의를 오픈하게 되었습니다. 

 

저의 초심자 시절 때 처럼 혼자선 막막하고 극한인 상황일 때 누가 옆에서 가이드 해줄 수 있는 분이 있었으면 좀 더 수월하게  프로젝트를 완료할 수 있지 않았을까? 

 

처음 접하시는 분이나 잘 모르는 분들에게 안내를 잘해  줄 수 있다면 정말 편할텐데? 라는 생각을 하며 강의 서비스를 오픈하였습니다.

 

처음 텍스트 분석을 배우시는 분들이 긴 강의를 들으시면  머리속에 정리되지 않은 정보때문에 혼란스럽습니다.(핵심만 요약한 짧은 강의를 오픈하였습니다!)

 

초심자 분들이 방황하지 않도록 실무에서 직접 활용 가능한 핵심적이고 간결한 코드로 강의를 제작하였습니다.

  •  
  •  
  •  

 

 

 

📚 입문자를 위해 가장 많이 활용되는 핵심 기법을 가르쳐 드립니다.

 

모든 연구 분야에서 점점 텍스트마이닝, 빅데이터를 도입합니다.

회사 실무 역시 텍스트 데이터를 다룰 줄 알아야 인정받을 수 있습니다.

요즘 대세인 빅데이터 및 텍스트마이닝을 복잡하고 어려운 코딩대신 누구나 쉽게 따라할 수 있게끔 효율적인 강의를 제작하였습니다. 

 

 

 

  •  
  •  
  •  
  • *참고) 지식공유자의 논문 포트폴리오들

     

    텍스트마이닝 논문 포트폴리오1

     

    텍스트마이닝 논문 포트폴리오2

    텍스트마이닝 포트폴리오3

  •  

    텍스트마이닝 포트폴리오4

     

    •  
  • (24년 기준) 현재 저는 텍스트마이닝 논문만 1저자로 10편이상을 썼고

    •  

    150회 이상 컨설팅을 하였습니다!

    •  

     

    •  
    • 컨설팅 후기 1

     

    • 컨설팅 후기 2

     

    • 컨설팅 후기3

     

    이 강의는 논문을 쓰는데 필요한 핵심비법을 전수해드립니다!

    •  

     

     

     

  •  
  •  

  •  

  •  

  • 📚파이썬을 활용한 텍스트 분석 프로젝트 및 논문 작성

      

    💻 이 강의는 텍스트마이닝 기법을 활용해 빅데이터 논문 작성을 도와드립니다!

    🚀 텍스트 분석에 대한 핵심 이론과 실무에서 활용할 수 있는 텍스트 분석 기법을 알려드립니다.

    🗝 대량의 텍스트 문서에서 인사이트를 발굴하실 수 있도록 도와드립니다.

     

  • ✅ 본 강의는 파이썬을 이용하여 빅데이터 분석과 텍스트마이닝 분석 기술을 배우며, 데이터와 텍스트에서 의미 있는 정보를 추출하는 방법을 다루는 강의입니다

  •  
  •  
  • ✅ 빅데이터 논문 작성을 위한 텍스트 분석 강의입니다(인식분석, 동향분석)

  •  
  •  
  • ✅ 데이터 수집 및 정제, 텍스트 데이터 전처리, 빈도 분석, TF-IDF 분석, 워드 클라우드, LDA,감성분석을 이용한 토픽 모델링 등을 학습합니다.

  •  
  •  

✅ 최신 LLM인 ChatGPT를 활용하여 좀 더 쉽게 빅데이터분석을 할 수 있는 방법을 안내합니다.

  •  
  •  

 

 

이런 걸 배워요 📚

  1. 파이썬을 이용하여 빅데이터와 텍스트 데이터를 분석하는 방법을 이해하게 됩니다.

  2. 데이터 분석에 필요한 데이터 전처리, 시각화, 통계 분석 등의 기술을 익히게 됩니다.

  3. 빅데이터 논문 작성 시 필요한 데이터 분석 스킬을 익힐 수 있습니다.

  4. 다양한 데이터와 텍스트 분석 도구와 기술을 익힘으로써, 데이터 분석 능력을 향상할 수 있습니다.

  5. 빅카인즈 데이터 자료를 수집해  논문에 쓰이는 데이터를 직접 추출하는 과정을 실습합니다.

  6. 요즘 트렌드인 AI모델 ChatGPT를 활용하여 빅데이터 분석을 좀 더 쉽게 할 수 있는 방법에 대해 안내 합니다.

 

 


이런 분들께 추천해요 🙆‍♀️

 

데이터 분야에서 일하는 연구자, 데이터 사이언티스트, 머신러닝 엔지니어

텍스트마이닝 및 빅데이터 논문작성 하시려는 연구원 대학원생

빅데이터 분석 및 텍스트마이닝 분석 기술에 관심이 있는 분들 누구나

이 강의와 함께해요 😊

  • 데이터 분석 및 논문 작성에 대한 불안감이 있는 수강생들은 이 강의를 통해 해당 능력을 강화할 수 있습니다.

  • 강의를 통해 데이터와 텍스트에서 의미 있는 정보를 추출하는 방법을 익힘으로써, 수강생들은 빅데이터 분석과 텍스트마이닝 분야에서 높은 수준의 능력을 갖출 수 있습니다. 이러한 능력은 수강생들의 직무 역량 강화 및 학업 성취도에 큰 도움이 될 것입니다.


강의 특징 ✨

논문 작성에 필요한 데이터 추출 및 분석에 대한  정보 제공

실제 파이썬을 활용한 데이터 분석 실습 진행

파이썬 초보자도 따라 할 수 있는 쉬운 설명

파이썬으로 빅데이터와 텍스트 데이터에서 의미 있는 정보를 추출하는 방법을 학습

이론과 실습의 적절한 비율! 이론을 바탕으로 실제 데이터 분석을 수행하는 실습 진행

 

 

 

 

 


이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 텍스트마이닝/빅데이터 논문을 쓰시고자 하시는 대학원생, 연구원

  • 텍스트마이닝 기법을 배우고 싶으신 분

  • 파이썬을 활용해 텍스트마이닝을 하시고자 하시는분

  • 텍스트마이닝 프로젝트 및 연구 과제 수행

  • 소셜 미디어 데이터 SNS를 데이터 분석을 원하시는 분

  • 마케팅을 위해 고객피드백, 리뷰 분석을 통해 고객 니즈 파악을 하고자 하시는 분

  • 감성분석을 해보고 싶으신분

선수 지식,
필요할까요?

  • 파이썬 기초 문법을 어느정도 아셔야 합니다

  • 구글 Colab에 대한 사용방법을 알아야 합니다

안녕하세요
이진규입니다.

수강생 수

2,314

수강평 수

60

강의 평점

4.6

강의 수

7

안녕하세요 AI와 빅데이터 분석에 진심인 해피AI 이진규입니다.

[강사약력]

이진규 (Lee JinKyu)

해피AI 대표 (Happy AI CEO, HappyNLP CEO)

생성 AI 및 빅데이터 분석 분야의 최신 트렌드, 인사이트, 기술 활용 방법을 깊이 있게 전달합니다.

 

🎒  강연 및 외주 문의

[email] leejinkyu0612@naver.com

[Blog] 📺 https://blog.naver.com/leejinkyu0612

[YouTube] 📺 https://www.youtube.com/@HappyAI_0612

[github] https://github.com/leejin-kyu/

[Homepage] https://happyaidata.kr

[H.P] 010-9973-2113

[kakao] jinkyu0612

 

 📘 크몽 Prime 전문가(상위 2%)📺 https://kmong.com/gig/345782

 삼성전자, 서울대, 교육청, 한국데이터산업진흥원, 이화여자대학교, 서울기술연구원, 경기연구원, 청운대학교,한국대기환경학회, 국립공원관리공단, 서울디지털재단, 세종대학교, 전남대학교 등 다수의 정부기관 및 교육기관 프로젝트 진행

의료,커머스,생태,법학,경제,예체능 등 다양한 도메인의 연구경험(총 연구 프로젝트 200회 이상 진행)

 

📘 Bio

- 2024.07~ 생성 AI 및 빅데이터 분석 전문기업 해피AI 대표

- 2023.01~ 생성 AI 기반 빅데이터 분석 전문기업 해피NLP

- 2022. 동국대학교 AI대학원 박사과정 수료(자연어처리 및 LLM 전공)

- 2023~ 퍼블릭 뉴스 AI 칼럼니스트(AI편향 및 RAG챗봇 전문)

- 2021~2023 AI/빅데이터 전문 기업 스텔라비전 개발자

- 2018~2021 공공기관 자연어처리/빅데이터 분석 연구원 (인문사회과학 데이터 연구)

- 2021 자연어처리/빅데이터 전문기업 Textom 최우수 Analyst

 

🎒Courses & Activities

2024

  • Langchain 및 RAG 등 LLM 프로그래밍.삼성SDS(2024)

  • ChatGPT 기반 빅데이터 분석 입문. 렛유인에듀 (2024)

  • 인공지능 기초 및 데이터 분석 기초 강의. 한국직업개발원 (2024)

  • LLM 실무자를 위한 LLM이론 및 Langchain 기반 RAG챗봇 개발 강의. 서울디지털 재단 (2024)

  • 텍스톰(Textom)을 활용한 텍스트마이닝(연구동향, SNS) 논문 작성법 강의. 인프런 (2024)

  • 쉽게 따라하는 LDA & 감성분석 빅데이터 논문 작성법 with ChatGPT. 인프런 (2024)

  • 파이썬을 활용한 텍스트 분석 강의. 서울과학기술대학교 (2024)

     

  • 파이썬 초보자를 위한 주가 데이터 분석 입문 강의. 인프런 (2024)

  • 연구자와 대학원생을 위한 감성분석 기법 실습 강의. 인프런 (2024)

  • 랭체인(LangChain)을 활용한 LLM 챗봇 만들기(feat.ChatGPT). 인프런 (2024)

2023

  • ChatGPT를 활용한 파이썬 기초 강의. 경기대학교 (2023)

  • 빅데이터 전문가 과정 특강. 단국대학교 (2023)

  • 빅데이터 분석 기초 강의. 렛유인에듀 (2023)

     

💻 Projects

  • 첨단바이오 분야 LLM-AI 활용을 위한 관련 데이터 전처리, 연계 기능 구현(

    한국과학기술정보연구원,KIST)

  • LLM 기반 산림 복원 빅데이터 분석(국립산림과학원)

  • Private LLM 기반 RAG 챗봇 모델 구축 (한국전력공사)

  • AI 기반 빅데이터 분석 기법을 적용한 설문 데이터 분석 (A정부기관)

  • 빅데이터 분석 기법을 통한 이용자 설문 데이터 분석 및 시각화 (코멘터리 사무소)

  • 내부망 전용 LLM을 활용한 텍스트마이닝 솔루션 개발 (D 정부기관)

  • 빅데이터 분석을 통한 한우시장 트렌드 분석 (이화브리오)

  • Instruction Tuning 및 강화학습(RLHF)을 통한 LLM 모델 개발 (서울디지털재단)

  • AI 언어모델 기반 헬스케어 서비스의 사용자 리뷰 텍스트 분석 (삼성전자)

  • 단어 임베딩 유사도를 활용한 Word2Vec 언어 모델 기반의 텍스트마이닝 기법을 활용한 설문 빅데이터 분석 (정림건축)

  • AI 언어 모델 기반 텍스트마이닝 기법을 활용한 SNS 인식 분석 (LMC)

  • 자연어 처리 기술 기반 텍스트마이닝을 활용한 연구동향 분석 (한국대기환경학회)

  • AI 모델 kopatBERT 기반 특허 논문 QA 모델 개발 (한국기술마켓)

  • 자연어 처리 기법을 활용한 설문 질적연구 자료 분석 (청운대학교)

  • AI 모델 kopatBERT 기반 특허 논문 분류 모델 개발 (한국기술마켓)

  • 딥러닝 기반 토픽모델링을 활용한 법학 설문 빅데이터 분석 (서울대학교)

  • 딥러닝 및 머신러닝 기반 텍스트 분석 기법을 활용한 간호 설문 질적연구 자료 분석 (충북대학교)

  • KorQuad를 활용한 BERT 기반 금융권 QA task 모델링 (B사)

  • 학술 데이터의 특성에 따른 Bert 기반 Multi-classification 모델 개발 (A사)

  • 인공지능 자연어 처리(NLP) 분야에 대한 최신 트렌드 및 기술 경향 분석 (Textom)

  • AI 모델 Word2Vec 및 TF 기반 의료 설문 빅데이터 Keyword 추출 알고리즘 개발 (D사)

  • AI 모델 Word2Vec과 감성분석을 적용한 설문 문항 빅데이터 분석 (경기연구원)

  • 딥러닝 기반 비대면 진료 관련 언론기사 토픽 분석 (한국보건의료연구원)

  • 언론보도 분석을 통한 캠핑 트렌드 인사이트 도출 (한국관광컨설팅)

  • AI 모델 RNN 기반 리뷰 인사이트 추출 및 분석 프로그램 개발 (서클플랫폼)

  • 주요 언론사 빅데이터 분석을 통한 안전사고 유형 분석 (서울기술연구원)

  • 뉴스 빅데이터 분석을 통한 '나는 SOLO' 인기 요인 분석 (Textom)

  • 우크라이나 러시아 전쟁에 대한 국민인식 분석 (Textom)

  • 주요 도서 카테고리별 크롤링 프로그램 개발 및 빅데이터 분석 (데이원컴퍼니)

  • AI 모델 Word2Vec 기반 텍스트마이닝 솔루션 프로그램 개발 (서클플랫폼)

  • 데이터 인력 분석을 위한 정보 수집 프로그램 개발 및 빅데이터 분석 (한국데이터산업진흥원)

  • 헬스케어 스토어 상품 리뷰 분석 (오므론헬스케어)

  • 기업 인터뷰 설문 빅데이터 분석 (인피플컨설팅)

  • 빅데이터 분석을 통한 여성원피스에 대한 니즈 분석 (Textom)

  • NLP 기법을 활용한 정맥간호 관련 인식 분석 (울산대학교)

  • 빅데이터 분석을 통한 인공지능에 대한 언론 보도경향 분석 (Textom)

  • 빅데이터 분석을 통한 축산물 트렌드 파악 및 분석 (중원푸드)

  • 빅데이터를 활용한 2022년 국립공원 탐방 키워드 분석 (국립공원관리공단)

  • 빅데이터 분석을 통한 서울맛집에 대한 인식 분석 (Textom)

  • 빅데이터 분석을 통한 재테크에 관한 언론보도 분석 (Textom)

  • 언론보도 분석을 통한 '골때리는 그녀들'에 대한 인기 요인 도출 (Textom)

  • 쇼팽 콩쿠르에 대한 언론보도 동향 분석 (Textom)

  • 월드컵 최종예선에 대한 국민인식 분석 (Textom)

  • 위드코로나에 대한 국민인식 분석 (Textom)

  • (언론보도자료) 빅데이터를 통해 본 국내 주요 숲길의 인기 비결 (국립산림과학원)

  • (언론보도자료) 빅데이터가 말하는 인제 자작나무 숲의 인기 비결 (국립산림과학원)

  • 빅데이터 분석을 통한 숲길 네트워크 구축 및 관리방안 도출 연구 (국립산림과학원)

  • 해외 휴양공간 빅데이터 제공 시설 구성요소 및 위계 분석을 통한 정보 서비스 체계 구축 (국립산림과학원)

  • 빅데이터 분석을 통한 산림휴양공간 핫스팟 지역 수요 예측 및 관리 기술 개발 (국립산림과학원)

  • 국내 주요 산림휴양공간별 빅데이터 분석을 통한 네트워크 체계 구축 및 중·장기 운영관리 로드맵 제시 (국립산림과학원)

  • 데이터 마이닝을 통한 산림 휴양공간 이용자 인식 도출 및 운영관리방안 설계 (국립산림과학원)

  • GIS 공간데이터 및 비정형 텍스트 정보 자료 분석을 통한 DMZ 숲길 최적 노선 기술 개발 및 현장 적용성 검토 (국립산림과학원)

이외에도 다수의 공공기관, 기업체와 개인적 의뢰 등 총 200건 이상 프로젝트 진행

📖 Publication

  • Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms.IEEE Access, JinKyu Lee, and Jihie Kim.2024. 논문 링크

  • Improving Generation of Sentiment Commonsense by Bias Mitigation" International Conference on Big Data and Smart Computing (BigComp). JinKyu Lee, and Jihie Kim.2023. 링크

  • Vanilla 프롬프팅 기법과 CoT 프롬프팅 기법 간 음악 편곡 결과 비교 분석 | 게임학회 | 2024

  • 언론기사 빅데이터 분석을 통한 대규모 언어모델에 대한 기술 인식 분석: ChatGPT 등장 전후를 중심으로 | 한국멀티미디어학회 | 2024 논문 링크

  • 정맥간호 인터넷 카페 Q & A 게시글의 키워드 네트워크 분석 | Healthcare Informatics Research | 2023.02 논문 링크

  • 자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020)분석 | 농업생명과학연구 | 2022 논문 링크

  • 텍스트마이닝을 활용한 백두대간에 관한 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크

  • 텍스트마이닝을 활용한 국내 산림생태 분야 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크

  • (NLP) 편향(Bias) 완화를 통한 감성 상식(Commonse)문장 생성 향상 기법 연구 (BART모델 사용) 논문 링크

  • 숲길에 대한 10 년간의 언론 인식분석-텍스트 마이닝 분석을 중심으로 | 산림경제연구 | 2021

  • 산림관광지로서 인제 자작나무 숲에 대한 소셜미디어 이용자 인식 연구 | 한국산림휴양학회 | 2020

이외에도 타 분야에서 다수의 학술논문, 학술발표, 연구보고서 등의 성과 창출

Others

  • Python을 활용한 데이터분석 및 시각화

  • LLM을 활용한 데이터분석

  • ChatGPT와 LangChain을 활용한 업무 생산성 향상

 

 

 

 

커리큘럼

전체

48개 ∙ (5시간 38분)

수업 자료

가 제공되는 강의입니다.

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!