데이터 사이언스

/

데이터 분석

텍스트마이닝 실전 프로젝트 - 뉴스 데이터 분석하기

프로그래밍 기초적인 지식도 배웠고 크롤링도 배웠고 텍스트 마이닝 강의도 들었는데, 실제로 프로젝트 하면 막막하셨나요? 저와 함께 프로젝트를 처음부터 끝까지 진행해 보는 강의입니다.

(3.3) 수강평 4

수강생 148

Thumbnail

중급자를 위해 준비한
[데이터 분석] 강의입니다.

이런 걸
배워요!

  • 뉴스 데이터 분석

  • Top keyword 시각화

  • word2vec

  • 추천 및 검색 시스템

🙆🏻‍♀ 텍스트 마이닝 실전 프로젝트 입니다. 뉴스 데이터 수집부터 월별 탑키워드 추출 및 시각화 그리고 뉴스추천 시스템까지 만들어보는 강의입니다!!🙆🏻‍♂

🗒 강의소개

 프로그래밍 기초적인 지식도 배웠고 크롤링도 배웠고 텍스트 마이닝 강의도 들었는데, 실제로 프로젝트 하면 막막하셨나요? 저와 함께 프로젝트를 처음부터 끝까지 진행해 보는 강의입니다.  이 강의에서는 다음과 같은 내용을 다룹니다.

🌈 뉴스데이터 수집 

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 뉴스데이터 전처리 및 탑키워드 추출 

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 엑셀로 Top keyword 시각화

일별/월별 탑키워드를 엑셀로 시각화 시켜봅니다

🌈 차트로 Top keyword 시각화

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 Word2vec 

Word reprensentation의 기본적으로 널리 많이 쓰이는 방법은 'word2vec'의 개념에 대해서 배우고 뉴스데이터로 학습을 시켜 봅니다.

🌈 검색 및 추천 모델 만들기

뉴스의 title을 sentence vec를 만들어 cosine 유사도를 이용하여 뉴스 검색 추천 모델을 만듭니다.

🙋🏻‍♂️ 궁금해요!

Q. R을 아예 몰라도 들을 수 있나요
A. R언어에 대한 기초적인 지식과 웹크롤링, 텍스트마이닝에 대한 기초적인 지식이 있으셔야 듣기 수월하십니다. ㅠㅠ. 제가 올린 R프로그래밍 기초강의(무료)와 텍스트마이닝 강의는 수강하고 들으시는걸 권장해 드립니다. 

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 텍스트 마이닝 프로젝트 해보고 싶으신분

  • 뉴스데이터 분석하고 싶으신 분

선수 지식,
필요할까요?

  • R프로그래밍

  • 웹크롤링

  • 텍스트마이닝 기초지식

안녕하세요
코코입니다.

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

커리큘럼

전체

14 ∙ 3시간 16분

수업 자료

가 제공되는 강의입니다.

강의 게시일: 2020년 01월 07일
마지막 업데이트일: 2020년 01월 07일

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!