인공지능

/

딥러닝 · 머신러닝

파이썬 기초 라이브러리부터 쌓아가는 머신러닝

머신러닝을 처음 접하시는 분들에게 공부 방향성과 기초 개념을 확실히 잡아드립니다.

(4.9) 수강평 35개

수강생 4,895명

초급자를 위해 준비한
[딥러닝 · 머신러닝] 강의입니다.

이런 걸
배워요!

  • Pandas 라이브러리를 통한 데이터 전처리 및 가공

  • Matplotlib과 Seaborn 라이브러리를 통한 데이터 시각화

  • 사이킷런 라이브러리를 활용한 머신러닝 이론 및 실습

  • Kaggle 데이터를 활용한 실전 연습

“거칠지만 유익한” 거친코딩과 함께,
기초부터 쌓아가는 파이썬 머신러닝 📖

머신러닝 첫걸음 제대로 떼고 싶다면?

머신러닝을 시작하기 위해 반드시 알아야 할
기초 라이브러리 및
실제 머신러닝 모델에 대해 배워보세요!
#Pandas #Matplotlib #Seaborn

앗, 혹시 내 얘기 아닌가요? 

요즘 인기있는 머신러닝이 
좋다는 건 알겠는데, 
어디서부터 시작할지 너무 막막해요.

머신러닝을 이미 배웠고 
적용하고 있기는 한데, 
내가 제대로 아는 게 맞는지 모르겠어요.


머신러닝, 왜 중요할까요?

날이 갈수록 중요성이 커져가고 있는 머신러닝! 
머신러닝이란 데이터를 가지고 다양한 통계적 알고리즘을 활용하여 학습하도록 컴퓨터를 프로그래밍하는 것을 말합니다. 
그런데, 머신러닝을 왜 사용하는지 알고 계신가요?

전통적인 기법을 통해 서비스 내 스팸 처리를 위한 필터를 만드는 경우를 예로 들겠습니다. 
이 경우, 다음과 같은 방식으로 스팸 필터를 만들게 되죠.

  1. 스팸에 주로 들어가는 '신용카드', '무료', '광고', '대출' 같은 단어, 구절이 있는 문장 패턴을 감지한다.
  2. 문장 패턴 감지를 하는 알고리즘을 만들어서 메일 스팸을 분류하게 한다.
  3. 알고리즘 테스트 및 평가를 진행한다.

위 방식은 간단해 보이지만, 문제가 점점 복잡해지고 규칙이 많아지면 유지보수가 힘들어집니다. 
반면 머신러닝을 활용하면 스팸에서 발생되는 패턴을 자동으로 학습함으로써 유지보수 용이 및 정확도를 훨씬 효과적으로 높일 수 있습니다.

그래서 우리는
머신러닝을 배워야 합니다!


머신러닝 학습이 
어렵게만 느껴졌다면?

요즘 머신러닝 기술이 사람들에게 널리 알려지고 많은 사랑과 인기를 받고 있는 만큼 시중에 관련 강의가 정말 많습니다. 하지만 대부분의 강의가 거의 똑같은 패턴으로 주제나 개념에 대해서만 딱딱하게 설명하고 있습니다. 실제 어떻게 적용되고, 사용할 수 있는지에 대해서는 설명이 부족한 상황이죠.

그래서 이 강의는 다른 강의들처럼 바로 머신러닝이라는 주제로 들어가지 않습니다.
대신 실제 데이터를 가지고 자유자재로 전처리해보고 시각화하면서, 실제 머신러닝을 해보기 전 꼭 필요한 라이브러리에 대해 배워본 다음 전반적인 머신러닝 개념에 대해서 배워볼 것입니다.

머신러닝을 ‘제대로’ 배울 수 있도록.

💡 머신러닝을 시작하기 위한 방향 설정을 할 수 있습니다.

💡 머신러닝에 대한 기본 개념을 확실히 익힐 수 있습니다.

💡 머신러닝 이외에 분석에 필요한 역량을 기를 수 있습니다.

그동안 쌓아올린 노하우를 바탕으로 머신러닝을 효과적으로 배울 수 있도록 도와드립니다.
머신러닝, 함께 도전해보실까요?


이런 분들 주목하세요!

파이썬 데이터 분석에 
관심있는 분 

머신러닝 공부를 
처음 시작하시는 분 

데이터 전처리, 가공을 
배우고 싶은 분 

머신러닝 이론을 
복습하고 싶으신 분 

선수 지식을 확인해주세요!

  • 프로그래밍 언어 파이썬(Python)에 대한 기초 문법을 알고 있어야 합니다.

어떤 내용을 배우나요?

캐글

Kaggle

판다스, 팬더스

Pandas

맷플롯립, 매트플롯, 맷플롯, 맷플롯라이브러리, 매트플롯라이브러리

Matplotlib

사이킷런, 싸이킷런

Scikit-Learn


이 강의의
장점을 확인하세요.

핵심만 제대로!

시중의 다른 많은
머신러닝 강의와 다르게,
꼭 필요한 내용만
요약해 소개해드립니다. 

실습으로 레벨 업

이론에만 그치지 않고 
사이킷런 빌트인 및 
캐글 데이터를 활용한 
실습을 제공해드립니다. 

초보자를 위한 머신러닝

파이썬 기초를 알고 있는 
초보자의 눈높이에 맞춰 
어렵지 않게 
개념을 익힐 수 있습니다. 

데이터 분석도?

머신러닝 개념뿐만 아니라 
데이터 분석에 필요한 
라이브러리 활용에 
대해서도 소개합니다. 

머신러닝을 ‘제대로’ 배울 수 있도록.

✅ 지금까지 머신러닝을 배우며 겪은 과정에서 체득한 노하우를 통해 효과적인 공부법을 알려드립니다.

✅ 전반적인 머신러닝 모델에 대한 이론 강의를 통해 헷갈렸던 개념을 상기시킬 수 있게 도와드립니다.

✅ 공부하시다가 어려운 게 있으시면 질문을 자유롭게 남겨주세요. 답변을 통해 해결해드리겠습니다.


기초부터 쌓아가는 머신러닝,
순서대로 학습해보세요!

1주차: Colab 설정 및 Pandas 라이브러리 기초 실습

  • Pandas 라이브러리를 활용한 데이터 전처리
  • 데이터 불러오기 및 저장
    • Series
    • DataFrame
    • DataFrame 행, 열 선택 및 필터링
    • DataFrame 행, 열 삭제
    • DataFrame 행, 열 수정

2주차: pandas 라이브러리 기초 실습 #2

  • Pandas 라이브러리를 활용한 데이터 전처리
    • DataFrame 행, 열 선택 및 필터링 복습
    • DataFrame 행, 열 삭제 복습
    • DataFrame 행, 열 수정 복습
    • DataFrame 그룹 생성
    • 중복 데이터 삭제
    • NaN 찾아서 다른 값 변경
    • apply함수 활용
    • 컬럼 내 유니크한 값 뽑아서 갯수 확인
    • 두 개의 DataFrame 합치기

3주차: Matplotlib과 Seaborn 라이브러리를 활용한 데이터 시각화

  • Bar 차트 이해 및 제작
  • Pie 차트 이해 및 제작
  • Line 차트 이해 및 제작
  • Scatter 차트 이해 및 제작
  • Heat Map 차트 이해 및 제작
  • Histogram 차트 이해 및 제작
  • Box 차트 이해 및 제작

4주차: 선형 회귀 이론 및 실습

  • 선형 회귀란 무엇인가
  • 선형 회귀 모델의 훈련과 비용함수
  • 선형 회귀 모델의 최적화 방법
    • 배치 경사 하강법
    • 확률적 경사 하강법
    • 미니배치 경사 하강법
  • 다항회귀
  • 규제가 있는 선형 모델
    • 릿지 회귀
    • 라쏘 회귀
    • 엘라스틱넷
  • 조기 종료(Early Stopping)

5주차: 선형 분류 이론 및 실습

  • 로지스틱 회귀란 무엇인가
  • 로지스틱 회귀 모델의 훈련과 비용함수
  • 서포트 벡터 머신이란 무엇인가
  • 서포트 벡터 머신의 분류
    • 하드 마진 분류
    • 소프트 마진 분류

6주차: 결정 나무 모형 이론 및 실습

  • 결정 나무 모형이란 무엇인가
  • 결정 트리 학습과 시각화
  • 예측하기
  • 클래스 확률 추정
  • CART 훈련 알고리즘
  • 계산 복잡도
  • 지니 불순도 또는 엔트로피
  • 규제 매개변수
  • 회귀

7주차: 앙상블 모형 이론 및 실습

  • 앙상블 모형이란 무엇인가
  • 투표 기반 분류기
  • 배깅과 페이스팅
    • 사이킷런의 배깅과 페이스팅
    • oob 평가
  • 랜덤 패치와 랜덤 서브스페이스
  • 랜덤 포레스트
    • 엑스트라 트리
    • 특성 중요도
  • 부스팅
    • 아다부스트
    • 그래디언트 부스팅
  • 스태킹

8주차: Kaggle 데이터 소개 및 분석 
9주차: Kaggle 데이터 분석

수강 전 참고해주세요!

  • 이 강의에서는 에디터로 구글 코랩(Google Colab)을 사용합니다.
  • 개념과 활용을 고루 익힐 수 있도록 이론 및 실습을 5:5 비중으로 구성하였습니다. 자세한 구성은 커리큘럼을 확인해주세요.
  • 블로그를 통해 강의 자료를 제공합니다. 다음 링크에서 보실 수 있습니다. (바로가기)

만나서 반가워요! 
거친코딩을 소개합니다.

지금 지식공유자 거친코딩의 VLOG를 확인해보세요! 🐯

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 머신러닝에 관심있는 사람

  • 머신러닝 입문자

  • 파이썬 시각화를 배우고 싶은 사람

  • 데이터 전처리 및 가공을 배우고 싶은 사람

선수 지식,
필요할까요?

  • 파이썬

🙌 소개

안녕하세요. 거칠지만 정말 유익한 데이터 분석가 "거친코딩" 입니다.

  • 고려대학교 통계학과 (졸업)

  • 고려대학교 대학원 빅데이터융합학과 (재학)

  • QS 세계대학평가 평가위원

  • 고려대학교 SW 중심대학 인공지능 심화 수료

  • 고려대학교 KUCC(컴퓨터 동아리) 세션장

  • 고려대학교 학과 5회 수석, 1회 전체 수석

  • 빅데이터분석기사 자격증

  • 빅데이터분석 준전문가(adsp) 자격증

  • 빅데이터 분석 및 개발 블로그 운영

  • 인공지능 강의 유튜브 운영

 

저는 현재 "네카 중 한 곳"에서 파이썬 및 시각화툴(Tableau)를 활용하여 데이터 수집, 가공, 분석, 예측, 시각화, 업무 자동화를 하고 있습니다.

 

⭐️ 멘토링

  • 데이터 분석 직무를 꿈꾸는 학생들을 위한 효율적 공부법

  • 데이터 분석 현업에 있는 주니어 분석가를 위한 상담

  • 현업에서 IT직군이 아니지만, IT 기술을 활용하여 본인 업무에 적용하고 싶은 분

 

🌈 멘토링 진행 방식

  • zoom을 통한 비대면 방식 진행

  • 준비물 : 컴퓨터, 카메라, 이어폰

  • 미리 준비한 질문 사항 혹은 현 상황에 따라 멘토링 진행

 

🐯 마무리 글

  • 모든 일에는 시작이 가장 중요합니다. 뜨거운 열정으로 이루고자 하는 것을 꼭 이뤄냅시다!..

 

📨 메일문의

rough_coding@naver.com

커리큘럼

전체

25개 ∙ (9시간 0분)

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!