이런 걸
배워요!
파이썬을 활용한 텍스트마이닝 핵심 비법 요약
단어빈도분석
워드클라우드 시각화
형태소 분석
텍스트에서 중요도를 파악할수 있는 TF-IDF
LDA기법을 활용한 텍스트 토픽 분류
빅데이터/텍스트마이닝 논문 작성시 데이터 해석법
텍스트마이닝의 핵심 이론 설명
KNU감성 사전을 활용한 감성분석 (감성어휘추출,감성문서비율)
데이터 분야에서 일하는 연구자, 데이터 사이언티스트, 머신러닝 엔지니어
텍스트마이닝 및 빅데이터 논문작성 하시려는 연구원 대학원생
빅데이터 분석 및 텍스트마이닝 분석 기술에 관심이 있는 분들 누구나
논문 작성에 필요한 데이터 추출 및 분석에 대한 정보 제공
실제 파이썬을 활용한 데이터 분석 실습 진행
파이썬 초보자도 따라 할 수 있는 쉬운 설명
파이썬으로 빅데이터와 텍스트 데이터에서 의미 있는 정보를 추출하는 방법을 학습
이론과 실습의 적절한 비율! 이론을 바탕으로 실제 데이터 분석을 수행하는 실습 진행
학습 대상은
누구일까요?
텍스트마이닝/빅데이터 논문을 쓰시고자 하시는 대학원생, 연구원
텍스트마이닝 기법을 배우고 싶으신 분
파이썬을 활용해 텍스트마이닝을 하시고자 하시는분
텍스트마이닝 프로젝트 및 연구 과제 수행
소셜 미디어 데이터 SNS를 데이터 분석을 원하시는 분
마케팅을 위해 고객피드백, 리뷰 분석을 통해 고객 니즈 파악을 하고자 하시는 분
감성분석을 해보고 싶으신분
선수 지식,
필요할까요?
파이썬 기초 문법을 어느정도 아셔야 합니다
구글 Colab에 대한 사용방법을 알아야 합니다
안녕하세요 AI와 빅데이터 분석에 진심인 해피AI 이진규입니다.
[강사약력]
이진규 (Lee JinKyu)
해피AI 대표 (Happy AI CEO, HappyNLP CEO)
생성 AI 및 빅데이터 분석 분야의 최신 트렌드, 인사이트, 기술 활용 방법을 깊이 있게 전달합니다.
🎒 강연 및 외주 문의
[email] leejinkyu0612@naver.com
[Blog] 📺 https://blog.naver.com/leejinkyu0612
[YouTube] 📺 https://www.youtube.com/@HappyAI_0612
[github] https://github.com/leejin-kyu/
[Homepage] https://happynlpdata.com
[H.P] 010-9973-2113
[kakao] jinkyu0612
📘 크몽 Prime 전문가(상위 2%)📺 https://kmong.com/gig/345782
삼성전자, 서울대, 교육청, 한국데이터산업진흥원, 이화여자대학교, 서울기술연구원, 경기연구원, 청운대학교,한국대기환경학회, 국립공원관리공단, 서울디지털재단, 세종대학교, 전남대학교 등 다수의 정부기관 및 교육기관 프로젝트 진행
의료,커머스,생태,법학,경제,예체능 등 다양한 도메인의 연구경험(총 연구 프로젝트 200회 이상 진행)
📘 Bio
- 2024.07~ 생성 AI 및 빅데이터 분석 전문기업 해피AI 대표
- 2023.01~ 생성 AI 기반 빅데이터 분석 전문기업 해피NLP
- 2022. 동국대학교 AI대학원 박사과정 수료(자연어처리 및 LLM 전공)
- 2023~ 퍼블릭 뉴스 AI 칼럼니스트(AI편향 및 RAG챗봇 전문)
- 2021~2023 AI/빅데이터 전문 기업 스텔라비전 개발자
- 2018~2021 공공기관 자연어처리/빅데이터 분석 연구원 (인문사회과학 데이터 연구)
- 2021 자연어처리/빅데이터 전문기업 Textom 최우수 Analyst
🎒Courses & Activities
2024
ChatGPT 기반 빅데이터 분석 입문. 렛유인에듀 (2024)
인공지능 기초 및 데이터 분석 기초 강의. 한국직업개발원 (2024)
LLM 실무자를 위한 LLM이론 및 Langchain 기반 RAG챗봇 개발 강의. 서울디지털 재단 (2024)
텍스톰(Textom)을 활용한 텍스트마이닝(연구동향, SNS) 논문 작성법 강의. 인프런 (2024)
쉽게 따라하는 LDA & 감성분석 빅데이터 논문 작성법 with ChatGPT. 인프런 (2024)
파이썬을 활용한 텍스트 분석 강의. 서울과학기술대학교 (2024)
파이썬 초보자를 위한 주가 데이터 분석 입문 강의. 인프런 (2024)
연구자와 대학원생을 위한 감성분석 기법 실습 강의. 인프런 (2024)
랭체인(LangChain)을 활용한 LLM 챗봇 만들기(feat.ChatGPT). 인프런 (2024)
2023
ChatGPT를 활용한 파이썬 기초 강의. 경기대학교 (2023)
빅데이터 전문가 과정 특강. 단국대학교 (2023)
빅데이터 분석 기초 강의. 렛유인에듀 (2023)
💻 Projects
Private LLM 기반 RAG 챗봇 모델 구축 (한국전력공사)
AI 기반 빅데이터 분석 기법을 적용한 설문 데이터 분석 (A정부기관)
빅데이터 분석 기법을 통한 이용자 설문 데이터 분석 및 시각화 (코멘터리 사무소)
내부망 전용 LLM을 활용한 텍스트마이닝 솔루션 개발 (D 정부기관)
빅데이터 분석을 통한 한우시장 트렌드 분석 (이화브리오)
Instruction Tuning 및 강화학습(RLHF)을 통한 LLM 모델 개발 (서울디지털재단)
AI 언어모델 기반 헬스케어 서비스의 사용자 리뷰 텍스트 분석 (삼성전자)
단어 임베딩 유사도를 활용한 Word2Vec 언어 모델 기반의 텍스트마이닝 기법을 활용한 설문 빅데이터 분석 (정림건축)
AI 언어 모델 기반 텍스트마이닝 기법을 활용한 SNS 인식 분석 (LMC)
자연어 처리 기술 기반 텍스트마이닝을 활용한 연구동향 분석 (한국대기환경학회)
AI 모델 kopatBERT 기반 특허 논문 QA 모델 개발 (한국기술마켓)
자연어 처리 기법을 활용한 설문 질적연구 자료 분석 (청운대학교)
AI 모델 kopatBERT 기반 특허 논문 분류 모델 개발 (한국기술마켓)
딥러닝 기반 토픽모델링을 활용한 법학 설문 빅데이터 분석 (서울대학교)
딥러닝 및 머신러닝 기반 텍스트 분석 기법을 활용한 간호 설문 질적연구 자료 분석 (충북대학교)
KorQuad를 활용한 BERT 기반 금융권 QA task 모델링 (B사)
학술 데이터의 특성에 따른 Bert 기반 Multi-classification 모델 개발 (A사)
인공지능 자연어 처리(NLP) 분야에 대한 최신 트렌드 및 기술 경향 분석 (Textom)
AI 모델 Word2Vec 및 TF 기반 의료 설문 빅데이터 Keyword 추출 알고리즘 개발 (D사)
AI 모델 Word2Vec과 감성분석을 적용한 설문 문항 빅데이터 분석 (경기연구원)
딥러닝 기반 비대면 진료 관련 언론기사 토픽 분석 (한국보건의료연구원)
언론보도 분석을 통한 캠핑 트렌드 인사이트 도출 (한국관광컨설팅)
AI 모델 RNN 기반 리뷰 인사이트 추출 및 분석 프로그램 개발 (서클플랫폼)
주요 언론사 빅데이터 분석을 통한 안전사고 유형 분석 (서울기술연구원)
뉴스 빅데이터 분석을 통한 '나는 SOLO' 인기 요인 분석 (Textom)
우크라이나 러시아 전쟁에 대한 국민인식 분석 (Textom)
주요 도서 카테고리별 크롤링 프로그램 개발 및 빅데이터 분석 (데이원컴퍼니)
AI 모델 Word2Vec 기반 텍스트마이닝 솔루션 프로그램 개발 (서클플랫폼)
데이터 인력 분석을 위한 정보 수집 프로그램 개발 및 빅데이터 분석 (한국데이터산업진흥원)
헬스케어 스토어 상품 리뷰 분석 (오므론헬스케어)
기업 인터뷰 설문 빅데이터 분석 (인피플컨설팅)
빅데이터 분석을 통한 여성원피스에 대한 니즈 분석 (Textom)
NLP 기법을 활용한 정맥간호 관련 인식 분석 (울산대학교)
빅데이터 분석을 통한 인공지능에 대한 언론 보도경향 분석 (Textom)
빅데이터 분석을 통한 축산물 트렌드 파악 및 분석 (중원푸드)
빅데이터를 활용한 2022년 국립공원 탐방 키워드 분석 (국립공원관리공단)
빅데이터 분석을 통한 서울맛집에 대한 인식 분석 (Textom)
빅데이터 분석을 통한 재테크에 관한 언론보도 분석 (Textom)
언론보도 분석을 통한 '골때리는 그녀들'에 대한 인기 요인 도출 (Textom)
쇼팽 콩쿠르에 대한 언론보도 동향 분석 (Textom)
월드컵 최종예선에 대한 국민인식 분석 (Textom)
위드코로나에 대한 국민인식 분석 (Textom)
(언론보도자료) 빅데이터를 통해 본 국내 주요 숲길의 인기 비결 (국립산림과학원)
(언론보도자료) 빅데이터가 말하는 인제 자작나무 숲의 인기 비결 (국립산림과학원)
빅데이터 분석을 통한 숲길 네트워크 구축 및 관리방안 도출 연구 (국립산림과학원)
해외 휴양공간 빅데이터 제공 시설 구성요소 및 위계 분석을 통한 정보 서비스 체계 구축 (국립산림과학원)
빅데이터 분석을 통한 산림휴양공간 핫스팟 지역 수요 예측 및 관리 기술 개발 (국립산림과학원)
국내 주요 산림휴양공간별 빅데이터 분석을 통한 네트워크 체계 구축 및 중·장기 운영관리 로드맵 제시 (국립산림과학원)
데이터 마이닝을 통한 산림 휴양공간 이용자 인식 도출 및 운영관리방안 설계 (국립산림과학원)
GIS 공간데이터 및 비정형 텍스트 정보 자료 분석을 통한 DMZ 숲길 최적 노선 기술 개발 및 현장 적용성 검토 (국립산림과학원)
이외에도 다수의 공공기관, 기업체와 개인적 의뢰 등 총 200건 이상 프로젝트 진행
📖 Publication
Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms.IEEE Access, JinKyu Lee, and Jihie Kim.2024. 논문 링크
Improving Generation of Sentiment Commonsense by Bias Mitigation" International Conference on Big Data and Smart Computing (BigComp). JinKyu Lee, and Jihie Kim.2023. 링크
Vanilla 프롬프팅 기법과 CoT 프롬프팅 기법 간 음악 편곡 결과 비교 분석 | 게임학회 | 2024
언론기사 빅데이터 분석을 통한 대규모 언어모델에 대한 기술 인식 분석: ChatGPT 등장 전후를 중심으로 | 한국멀티미디어학회 | 2024 논문 링크
정맥간호 인터넷 카페 Q & A 게시글의 키워드 네트워크 분석 | Healthcare Informatics Research | 2023.02 논문 링크
자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020)분석 | 농업생명과학연구 | 2022 논문 링크
텍스트마이닝을 활용한 백두대간에 관한 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크
텍스트마이닝을 활용한 국내 산림생태 분야 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크
(NLP) 편향(Bias) 완화를 통한 감성 상식(Commonse)문장 생성 향상 기법 연구 (BART모델 사용) 논문 링크
숲길에 대한 10 년간의 언론 인식분석-텍스트 마이닝 분석을 중심으로 | 산림경제연구 | 2021
산림관광지로서 인제 자작나무 숲에 대한 소셜미디어 이용자 인식 연구 | 한국산림휴양학회 | 2020
이외에도 타 분야에서 다수의 학술논문, 학술발표, 연구보고서 등의 성과 창출
Others
Python을 활용한 데이터분석 및 시각화
LLM을 활용한 데이터분석
ChatGPT와 LangChain을 활용한 업무 생산성 향상
전체
48개 ∙ (5시간 38분)
가 제공되는 강의입니다.
텍스트마이닝소개 및 수집과정 설명
03:50
데이터 전처리 이론소개
02:21
LDA기본이론
04:41
빅카인즈 뉴스 기사 데이터 수집 하기
05:44
구글 코랩에서 실습 준비하기
02:41
빈도(TF)구하기
05:49
TF_IDF구하기
04:55
TF_IDF워드크라우드시각화
03:40
LDA분석용 데이터만들기
07:24