인프런 영문 브랜드 로고
인프런 영문 브랜드 로고
데이터 사이언스

/

데이터 분석

R로 무작정 해보는 data science

R을 통해 무작정 datascience를 해보는 강의 입니다. 데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다.

(3.8) 수강평 6개

수강생 73명

Thumbnail

중급자를 위해 준비한
[데이터 분석, 딥러닝 · 머신러닝] 강의입니다.

이런 걸
배워요!

  • R로 머신러닝 모델 적합 시키는 법

  • 머신러닝 모델 성능 늘리는 법

🙆🏻‍♀ R을 통해 무작정 datascience를 해보는 강의입니다.
데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다..🙆🏻‍♂

"99.9% livecoding, 한 줄 한 줄 따라쳐보면서 배우는 DataScience"

✅ 주의사항

이 강의는 이론보다 실습에 초점이 맞춰져 있는 강의입니다.
R에 대한 기본적인 지식과 머신러닝에 대한 전반적인 지식이 있으셔야 합니다.

🗒 강의소개

R도 배웠고, 머신러닝도 배웠는데  데이터 분석을 할 줄 모르시나요? 
이 강의는 데이터 입력부터 머신러닝 모델 구축 및 모델 성능 향상 전략까지 직접 한 줄 한 줄 코드를 쳐보면서 배우는 강의입니다. 

🌈 머신러닝 모델 무작정 적합해보기

  • R의 기본 데이터로 Linear regression과 Decision tree를 적합해봅니다.
  • 회귀모델을 해석하고 학습 검증 데이터를 나누는 방법에 대해 이야기합니다.

🌈 심장 질병 예측 모델 구축해보기(Linear regression)

  • 로지스틱 회귀분석을 통해 심장 질병 예측 모델을 구축해봅니다. 
  • 변수선택법에 대해 배우고 stepwise/forawrd/backward regression을 각각 적합해봅니다.

🌈 영화 리뷰 감성분석으로 해보는 머신러닝

  • 영화 리뷰 데이터 수집부터 감성모델 구축까지 모두 해봅니다.
  • 가장 기본적으로 쓰이는 텍스트 전처리 방법인 Dcoument Term Matrix를 통해 모델을 구축해봅니다.
  • Ensemble learning 기법을 적용해 봅니다.
  • Word2vec을 활용하여 review를 vector화 시키고 이를 통해 머신러닝 모델을 적합해봅니다.

🌈 kaggle 데이터 분석으로 배우는 머신러닝

  • Class가 불균형한 데이터를 다루는 방법에 대해 이야기 합니다.
  • RandomOversampling/SMOTE/DBSMOTE 등을 적합해봅니다.
  • 문제에 따라 모델의 성능을 높일 수 있는 방안에 대해 고민해보고 직접 구현해 봅니다.

🙋🏻‍♂️ 궁금해요!

Q. R을 어느 정도 할 줄 알아야 하나요?
A. 기본적으로 데이터를 불러들이고 전처리할 줄 아셔야 합니다. R프로그래밍 기초 강의는 필수로 수강을 하셔야 하며, 중급강의는 선택사항입니다.

Q. 머신러닝과 통계학은 어느 정도 알아야 하나요?
A. 기초적인 통계학(t.test/anova 등, 학부 교양수업 수준)을 알고 계시고, 머신러닝에 대한 이론적인 지식(학부 전공 수업 수준)이 있으셔야 듣기 수월하십니다.

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 통계학도 배웠고 머신러닝도 배웠는데 실전경험이 없으신 분

  • 여러 머신러닝 모델을 적합해보고 싶으신 분

선수 지식,
필요할까요?

  • R에 대한 전반 적인 지식

  • 통계학과 머신러닝 기초

안녕하세요
코코입니다.

수강생 수

8,011

수강평 수

485

강의 평점

4.4

강의 수

20

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

커리큘럼

전체

32개 ∙ (7시간 23분)

수업 자료

가 제공되는 강의입니다.

  • 오리엔테이션

    04:16

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!