채널톡 아이콘
BEST

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

Pandas로 데이터 분석, 전처리, 머신러닝, 딥러닝에 활용하다 보면 늘 사용하는 기능 위주로 사용하게 됩니다. 이런 핵심적인 내용만을 모아 정리해 놓은 Pandas Cheat Sheet가 있습니다. 두꺼운 책으로 Pandas를 배우다 지치신 분들께 단 두 장의 문서로 Python Pandas를 알려드립니다. Pandas 공식 튜토리얼에서 제공하는 cheat sheet로 Pandas의 핵심 기능을 익혀봅니다.

Thumbnail

초급자를 위해 준비한
[데이터 분석, 데이터 분석] 강의입니다.

이런 걸 배울 수 있어요

  • 판다스 치트 시트에서 전하는 핵심 기능

  • 파이썬 데이터 분석

  • 머신러닝, 딥러닝을 위한 데이터 전처리

  • 데이터 시각화

  • 서울시 코로나19 사이트를 판다스로 크롤링, 전처리, 분석, 시각화 하기

파이썬 판다스 데이터 분석, 핵심만 한번에! 

단 두 장의 문서로 
판다스 데이터 분석을 
해결할 수 있다구요?

Python에서 엑셀과 유사한 기능을 사용할 수 있는 라이브러리로 Pandas(판다스)가 있습니다.

엑셀로 감당 안 되는 
대규모 데이터 처리도 OK.

판다스는 데이터 분석, 전처리를 위한
파이썬 데이터 분석 라이브러리입니다.

파이썬 판다스로 데이터 분석이나 전처리, 시각화를 하다 보면 주로 사용하는 기능들 위주로 사용하게 됩니다. 그리고 바로 이런 핵심적인 기능을 단 두 장에 정리해 둔 치트 시트(Cheet Sheets)가 있습니다. 

그런데, 이런 핵심적인 내용만 정리되어 있는 치트 시트를 혼자 보려면 어떤 내용을 어떻게 실습해야 할지 막막할 수 있습니다. 이 강의에서는 치트 시트의 핵심 내용만을 뽑아서 설명한 뒤, 복잡한 Matplotlib을 Pandas로 쉽게 사용할 수 있는 방법을 안내해드립니다. 함께 도전해보실까요?


누가 배우면 좋을까요?

데이터 분석, 
ML/DL에 필요한 
전처리를 하고자 
하시는 분 

큰 용량의 데이터를 
엑셀로 열다가 
파일이 열리지 않아 
당황하셨던 분 

엑셀을 사용해 
데이터 분석을 하다 
복잡한 수식에 
지치신 분 

엑셀에서 다양한 
수식을 구현했지만 
속도가 느려 
야근을 해야 했던 분 

📣 선수 지식을 확인해주세요!

  • 파이썬 및 주피터 노트북, 아나콘다(Anaconda), 엑셀의 행/열 개념에 대한 선수 지식이 필요합니다.

공식문서 중심으로 
쉽고 빠르고 정확하게.

하나, 주피터 노트북에서 
docstring 활용하기 

많은 메소드를 다 외울 필요 없습니다. 쓰이는 기능은 정해져 있으니까요. 이 강의에서는 도움말과 다큐멘트를 보고 스스로 학습하실 수 있도록 주피터 노트북에서 공식 문서를 찾아보며 실습하는 방법을 알려드립니다.

둘, 판다스 데이터 시각화 
2배로 잘 하는 법! 

어떤 데이터에 어떤 그래프를 사용하는 게 적절할지 잘 알고 계신가요? 이 강의에서는 막대그래프, 도수분포표, 히스토그램, 정규분포의 차이와 사용법에 대해서도 살펴봅니다. 뿐만 아니라 다양한 파이썬 시각화 방법 및 옵션 사용법에 대해서도 판다스 공식 문서를 통해 설명합니다.

보너스, Series와 DataFrame 데이터 시각화까지!

파이썬 판다스 시각화 예제

파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제

추가 업데이트! 
실무에 딱 맞는
데이터 분석 프로젝트.

서울시 코로나-19 발생현황 사이트를 데이터 크롤링부터 전처리, 분석, 시각화까지 판다스를 활용해 분석해 봅니다. 단 두 장의 문서로 익혀본 내용을 현업과 유사한 프로젝트로 분석해 볼 수 있습니다. (섹션 13)

하나, 뉴스를 통해 일상에서 자주 접하는 데이터를 직접 분석해 봅니다.

  • 확진자가 가장 많이 나온 구는 어디일까요?
  • 어느 병원에서 확진자를 가장 많이 치료했을까요? 
  • 구별로 많이 이송되는 병원이 있을까요?
  • 해외유입 확진자가 가장 많이 나온 구는 어디일까요?
  • 여러 국가를 유럽, 남미 등으로 텍스트 전처리를 하기 위해서는 어떻게 해야 될까요?
  • 해외유입 확진은 월별로 어떤 어느 정도 차이가 날까요?

둘, 판다스를 통한 데이터 전처리 방법을 이해하고 실습해 봅니다.

  • 텍스트로 된 날짜에서 연, 월, 일, 요일, 주는 어떻게 구할까요?
  • 확진자 현황 데이터로 누적 확진수는 어떻게 구할까요?
  • groupby, crosstab, pivot, pivot_table의 차이는 어떻고, 어떤 기능을 사용하는 게 적합할까요?

셋, 데이터프레임과 시리즈의 데이터 구조를 이해하고 분석에 적합한 형태로 가공해 봅니다.

  • Pandas의 plot으로 그래프를 그리기 위한 데이터프레임의 형태는 어떻게 만들어야 할까요?
  • 그래프에서 범주형 값에 따라 다른 색상으로 값을 표현하고 싶다면 데이터프레임을 어떻게 변경해야 할까요?
  • 시리즈를 데이터프레임으로 바꾸는 방법은 어떤 방법이 있을까요?

파이썬 시각화 & 분석 예제,
강의에서 직접 확인해보세요!


이 강의를 만든
지식공유자가 궁금하다면? 👩‍💻

지식공유자 박조은 X 인프런 인터뷰

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 파이썬으로 데이터 분석, 머신러닝, 딥러닝에 필요한 전처리를 하고자 하시는 분

  • 큰 용량의 데이터를 엑셀로 열다가 파일이 로드되지 않아 당황하셨던 분

  • 엑셀의 복잡한 수식에 지치신 분

  • 엑셀에서 다양한 수식을 구현했지만 속도가 느려 야근을 해야 했던 분

선수 지식,
필요할까요?

  • 파이썬

  • 주피터 노트북

  • 아나콘다

  • 엑셀의 행과 열 개념

안녕하세요
박조은입니다.

18,289

수강생

758

수강평

1,328

답변

4.8

강의 평점

6

강의

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

더보기

커리큘럼

전체

63개 ∙ (11시간 10분)

해당 강의에서 제공:

수업자료
강의 게시일: 
마지막 업데이트일: 

수강평

전체

168개

4.8

168개의 수강평

  • 세바스찬 주니어 3세

    수강평 15

    평균 평점 4.7

    5

    89% 수강 후 작성

    초급자로서 판다스에 대한 개념을 전반적으로 익히고, 실제 분석에 어떻게 활용할 수 있을지 꼼꼼하게 배울 수 있는 명강의라고 생각합니다. 판다스 관련 강의들을 몇 가지 들어봤는데 세심한 부분들까지 하나하나 퀄리티있게 알려주는 강의는 이 강의 밖에는 없는 것 같아요. 다시 한 번 더 복습을 한 뒤에 실제 업무용 데이터로도 적용해서 분석해보려고 합니다. 좋은 강의 만들어주셔서 진심으로 감사드립니다!!

    • 티보그

      수강평 1

      평균 평점 5.0

      5

      89% 수강 후 작성

      강사님의 분석 방법을 내것으로 만들고 싶어요. 감사합니다.

    • Eason Jung

      수강평 1

      평균 평점 4.0

      4

      100% 수강 후 작성

      전체적으로 좋은 강좌였습니다. 저의 경의 판다스를 혼자 책으로 공부하고 이 강좌를 판다스 반복 학습 및 응용을 목적으로 신청하여 듣게 되었습니다. 판다스 치트시트 강좌는 사실 별로였습니다. 판다스를 처음 보시거나 파이썬을 처음, 아님 아주 기초분이신분들은 별로 도움이 안되실겁니다. 유튜브영상으론 괜찮은데 돈을받고 강의로썬 좀 안타까운 부분이 있습니다. 서울시 코로나 분석 강의는 좋았습니다. 판다스를 응용하여 데이터를 어떤게 가공하여 자신이 원하는 형태, 결과를 얻을수 있는가를 연습할수 있어서, 판다스 기초를 공부한 저로썬 아주 유용한 파트가 되었습니다. 그리고 중간중간에 알려주시는 팁도 엄청 도움이 많이 되었습니다. shift-tab이라던가, 함수뒤 ? 을 사용하여 돗스트링을 볼수 있다던가... 아마 이런게 꿀팁이겠죠... 한줄 요약 : 판다스 처음 시작하시는 분들껜 비추, 판다스좀 아시는 분들께 강추합니다.

      • 박태렬

        수강평 1

        평균 평점 5.0

        5

        100% 수강 후 작성

        통계학과를 졸업 후 데이터 분석직으로 일하다가 퇴사하고 박조은님 강의 통해서 파이썬을 이용한 데이터 분석 공부중입니다. 뻔한 예제 데이터가 아니라 시기적절한 데이터 활용해서 쉽게 알려주셔서 흥미있게 강의 따라갈 수 있었습니다. 유튜브도 잘 보고 있습니다. 감사합니다!

        • pooh9431

          수강평 1

          평균 평점 5.0

          5

          37% 수강 후 작성

          좋은 커리큘럼입니다 저같은 입문자도 작동원리와 결과물을 함께 볼 수 있었고 무엇보다 질의응답 부분이 너무 마음에 듭니다. 모르는것이 있으면 선생님께 질문하듯 편하게 질의응답을 바로 바로 해주시고 그리고 선생님 목소리의 파장대가 너무 좋아서 집중이 잘됩니다.

          박조은님의 다른 강의

          지식공유자님의 다른 강의를 만나보세요!

          비슷한 강의

          같은 분야의 다른 강의를 만나보세요!

          ₩45,100