이런 걸
배워요!
형태소분석 하는 방법
Top keyword추출
Wordcloud 이쁘게 그리는 법
감성분석
Topic Modeling(LDA)
쏟아지는 데이터의 바다에서
보석 같은 정보를 만들어봐요! 💎
텍스트 마이닝(Text Mining)은 비정형 데이터에 대한 마이닝 과정입니다. 마이닝은 통계적으로 유의미한 개념을 추출하고, 이들 사이의 패턴을 통해 정보를 끌어내는 과정이예요. 이중 텍스트 마이닝은 동영상이나 메시지, 위치 정보 등 비정형 데이터를 이용한 마이닝을 말합니다. 하지만 비정형 데이터는 정해진 형태가 없기 때문에 데이터 수집이 어려워요.
이번 강의에선 SNS의 활성화로 인해 중요성이 높아지고 있는 비정형 데이터를 다루는 방법을 배울 수 있어요!
형태소 분석기 KoNLP에 대해서 알아보고 Topkeyword를 추출해보고 wordcloud를 그려봅니다
사전을 직접 구축해서 감성 분석하는 방법과 회귀분석(머신러닝)을 통해 감성 분석하는 것에 대해 알아봅니다.
감성 분석(Sentiment Analysis)는 텍스트에 녹아있는 감정이나 의견 같은 주관적인 정보를 단어나 문맥을 바탕으로 수치화하여 분석하는 절차입니다. 감정 분석은 상품이나 서비스에 대한 소비자들의 의견을 듣고, 이를 활용하는 등 비즈니스에서도 활발히 이용되고 있습니다. 감성 분석 역시 텍스트 마이닝 기술의 일종입니다.
Q. 비전공자도 들을 수 있나요?
R언어에 대해 기초적인 지식이 있다는 전제 하에 강의를 진행합니다. R로하는 웹크롤링 입문편을 수강하신 분들은 문제 없이 들으실 수 있습니다.
학습 대상은
누구일까요?
R로 텍스트마이닝 하고 싶으신분
크롤링 강의를 수강하신 분
학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.
수상
ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)
ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)
ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016)
ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)
ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)
* blog : https://bluediary8.tistory.com
주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.
크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :)
크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고
전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)
지금은 인공지능을 연구하는 박사과정생입니다.
전체
13개 ∙ (4시간 10분)
가 제공되는 강의입니다.