인프런 영문 브랜드 로고
인프런 영문 브랜드 로고
BEST
데이터 사이언스

/

데이터 분석

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다.

(4.6) 수강평 41개

수강생 2,763명

Thumbnail

중급자를 위해 준비한
[데이터 분석, 인공지능] 강의입니다.

이런 걸
배워요!

  • 자연어처리(NLP)

  • 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법)

  • 텍스트 데이터 시각화 기법(Matplotlib, Seaborn), 머신러닝(Scikit-learn)

  • 딥러닝/머신러닝, 데이터 분석

  • 파이썬 표준 라이브러리를 통한 간단한 퍼셉트론 구현

  • 온라인 러닝, Vowpal Wabbit 개념

  • 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec)

  • 파이프라인 구현을 통해 성능 최적화

  • 앙상블(Random Forest)과 부스팅(Xgboost) 기법

영화 리뷰로 보는 머신러닝 감성 분석 🎞️
데이터 전처리부터 평가, 예측까지!

자연어처리 이론과 실습을
한번에 배우고 싶다면? 👩‍💻

이 강의는 캐글(Kaggle)에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 수업입니다. 자연어 처리는 챗봇, 텍스트분석뿐만 아니라 머신러닝/딥러닝 모델 개발 시의 데이터 전처리 과정에서 널리 사용됩니다. 

자연어처리를 다루지만 데이터 전처리부터 각종 머신러닝 기법과 딥러닝 기법을 두루 다루며, 지도학습과 비지도학습의 활용 방안도 살펴봅니다. 캐글에 있는 기본 튜토리얼뿐만 아니라 텍스트 데이터 시각화나 전처리 과정, 파이프라인을 통한 병렬처리를 통한 성능 개선을 추가로 다룰 예정입니다. 함께 도전해볼까요?

강의 튜토리얼을 먼저 확인해보세요!

이 강의가 
도움이 되는 분들 🔍

복잡한 
텍스트 데이터로부터 
의미를 찾고자 
하는 분 

개발을 위해 
자연어 처리를 
배우고자 하는 
챗봇 개발자 

감정 분석에 필요한 
여러 가지 기법을 
배우고자 하는 
데이터 분석가 

머신러닝/딥러닝, 
NLP 등에 
쉽고 재미있게 
입문하고 싶은 분 


강의를 들으면
무엇을 할 수 있나요? 📌

IMDB 영화 리뷰 데이터를 통해 머신러닝의 분류 기법을 배울 수 있습니다. 머신러닝의 지도학습과 비지도 학습에 대한 활용방안을 두루 배우게 됩니다. 지도 학습으로는 머신러닝을 통한 감정 분석을 하게 되며, 비지도 학습으로 차원 축소와 클러스터링 기법을 배우게 됩니다.

  • 자연어처리(NLP: Neuro-Linguistic Programming)
  • 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법)
  • 데이터 분석
  • 텍스트 데이터 시각화 기법(Matplotlib, Seaborn)
  • 머신러닝(Scikit-learn) 및 딥러닝
  • 파이썬(Python) 표준 라이브러리를 통한 간단한 퍼셉트론 구현
  • 온라인 러닝, Vowpal Wabbit 개념
  • 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec)
  • 파이프라인 구현을 통해 성능 최적화
  • 앙상블(Random Forest)과 부스팅(Xgboost)기법

📣 수강 전 확인해주세요!

  • 4GB 이상의 메모리, 듀얼코어 이상의 CPU 환경에서 수강하는 것을 권장합니다.
  • 텍스트 데이터 전처리에 시간이 오래 걸리기에 장비의 성능이 조금 부족하다면 영상 하단의 Google Colaboratory 링크를 통해 실습해 주세요!

이 강의를 만든
지식공유자가 궁금하다면? 👩‍💻

지식공유자 박조은 X 인프런 인터뷰

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 복잡한 텍스트 데이터로 부터 의미를 찾고자 하는 사람

  • 챗봇개발자, 데이터 분석가, 머신러닝, 딥러닝 입문자

선수 지식,
필요할까요?

  • 파이썬 판다스 데이터 분석

  • 머신러닝/딥러닝 기초

안녕하세요
박조은입니다.

수강생 수

18,075

수강평 수

755

강의 평점

4.8

강의 수

6

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

커리큘럼

전체

17개 ∙ (3시간 30분)

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!