채널톡 아이콘
BEST

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

Pandas로 데이터 분석, 전처리, 머신러닝, 딥러닝에 활용하다 보면 늘 사용하는 기능 위주로 사용하게 됩니다. 이런 핵심적인 내용만을 모아 정리해 놓은 Pandas Cheat Sheet가 있습니다. 두꺼운 책으로 Pandas를 배우다 지치신 분들께 단 두 장의 문서로 Python Pandas를 알려드립니다. Pandas 공식 튜토리얼에서 제공하는 cheat sheet로 Pandas의 핵심 기능을 익혀봅니다.

Thumbnail

초급자를 위해 준비한
[데이터 분석, 데이터 분석] 강의입니다.

이런 걸 배울 수 있어요

  • 판다스 치트 시트에서 전하는 핵심 기능

  • 파이썬 데이터 분석

  • 머신러닝, 딥러닝을 위한 데이터 전처리

  • 데이터 시각화

  • 서울시 코로나19 사이트를 판다스로 크롤링, 전처리, 분석, 시각화 하기

파이썬 판다스 데이터 분석, 핵심만 한번에! 

단 두 장의 문서로 
판다스 데이터 분석을 
해결할 수 있다구요?

Python에서 엑셀과 유사한 기능을 사용할 수 있는 라이브러리로 Pandas(판다스)가 있습니다.

엑셀로 감당 안 되는 
대규모 데이터 처리도 OK.

판다스는 데이터 분석, 전처리를 위한
파이썬 데이터 분석 라이브러리입니다.

파이썬 판다스로 데이터 분석이나 전처리, 시각화를 하다 보면 주로 사용하는 기능들 위주로 사용하게 됩니다. 그리고 바로 이런 핵심적인 기능을 단 두 장에 정리해 둔 치트 시트(Cheet Sheets)가 있습니다. 

그런데, 이런 핵심적인 내용만 정리되어 있는 치트 시트를 혼자 보려면 어떤 내용을 어떻게 실습해야 할지 막막할 수 있습니다. 이 강의에서는 치트 시트의 핵심 내용만을 뽑아서 설명한 뒤, 복잡한 Matplotlib을 Pandas로 쉽게 사용할 수 있는 방법을 안내해드립니다. 함께 도전해보실까요?


누가 배우면 좋을까요?

데이터 분석, 
ML/DL에 필요한 
전처리를 하고자 
하시는 분 

큰 용량의 데이터를 
엑셀로 열다가 
파일이 열리지 않아 
당황하셨던 분 

엑셀을 사용해 
데이터 분석을 하다 
복잡한 수식에 
지치신 분 

엑셀에서 다양한 
수식을 구현했지만 
속도가 느려 
야근을 해야 했던 분 

📣 선수 지식을 확인해주세요!

  • 파이썬 및 주피터 노트북, 아나콘다(Anaconda), 엑셀의 행/열 개념에 대한 선수 지식이 필요합니다.

공식문서 중심으로 
쉽고 빠르고 정확하게.

하나, 주피터 노트북에서 
docstring 활용하기 

많은 메소드를 다 외울 필요 없습니다. 쓰이는 기능은 정해져 있으니까요. 이 강의에서는 도움말과 다큐멘트를 보고 스스로 학습하실 수 있도록 주피터 노트북에서 공식 문서를 찾아보며 실습하는 방법을 알려드립니다.

둘, 판다스 데이터 시각화 
2배로 잘 하는 법! 

어떤 데이터에 어떤 그래프를 사용하는 게 적절할지 잘 알고 계신가요? 이 강의에서는 막대그래프, 도수분포표, 히스토그램, 정규분포의 차이와 사용법에 대해서도 살펴봅니다. 뿐만 아니라 다양한 파이썬 시각화 방법 및 옵션 사용법에 대해서도 판다스 공식 문서를 통해 설명합니다.

보너스, Series와 DataFrame 데이터 시각화까지!

파이썬 판다스 시각화 예제

파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제

추가 업데이트! 
실무에 딱 맞는
데이터 분석 프로젝트.

서울시 코로나-19 발생현황 사이트를 데이터 크롤링부터 전처리, 분석, 시각화까지 판다스를 활용해 분석해 봅니다. 단 두 장의 문서로 익혀본 내용을 현업과 유사한 프로젝트로 분석해 볼 수 있습니다. (섹션 13)

하나, 뉴스를 통해 일상에서 자주 접하는 데이터를 직접 분석해 봅니다.

  • 확진자가 가장 많이 나온 구는 어디일까요?
  • 어느 병원에서 확진자를 가장 많이 치료했을까요? 
  • 구별로 많이 이송되는 병원이 있을까요?
  • 해외유입 확진자가 가장 많이 나온 구는 어디일까요?
  • 여러 국가를 유럽, 남미 등으로 텍스트 전처리를 하기 위해서는 어떻게 해야 될까요?
  • 해외유입 확진은 월별로 어떤 어느 정도 차이가 날까요?

둘, 판다스를 통한 데이터 전처리 방법을 이해하고 실습해 봅니다.

  • 텍스트로 된 날짜에서 연, 월, 일, 요일, 주는 어떻게 구할까요?
  • 확진자 현황 데이터로 누적 확진수는 어떻게 구할까요?
  • groupby, crosstab, pivot, pivot_table의 차이는 어떻고, 어떤 기능을 사용하는 게 적합할까요?

셋, 데이터프레임과 시리즈의 데이터 구조를 이해하고 분석에 적합한 형태로 가공해 봅니다.

  • Pandas의 plot으로 그래프를 그리기 위한 데이터프레임의 형태는 어떻게 만들어야 할까요?
  • 그래프에서 범주형 값에 따라 다른 색상으로 값을 표현하고 싶다면 데이터프레임을 어떻게 변경해야 할까요?
  • 시리즈를 데이터프레임으로 바꾸는 방법은 어떤 방법이 있을까요?

파이썬 시각화 & 분석 예제,
강의에서 직접 확인해보세요!


이 강의를 만든
지식공유자가 궁금하다면? 👩‍💻

지식공유자 박조은 X 인프런 인터뷰

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 파이썬으로 데이터 분석, 머신러닝, 딥러닝에 필요한 전처리를 하고자 하시는 분

  • 큰 용량의 데이터를 엑셀로 열다가 파일이 로드되지 않아 당황하셨던 분

  • 엑셀의 복잡한 수식에 지치신 분

  • 엑셀에서 다양한 수식을 구현했지만 속도가 느려 야근을 해야 했던 분

선수 지식,
필요할까요?

  • 파이썬

  • 주피터 노트북

  • 아나콘다

  • 엑셀의 행과 열 개념

안녕하세요
박조은입니다.

18,585

수강생

772

수강평

1,330

답변

4.8

강의 평점

6

강의

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

더보기

커리큘럼

전체

63개 ∙ (11시간 10분)

해당 강의에서 제공:

수업자료
강의 게시일: 
마지막 업데이트일: 

수강평

전체

169개

4.8

169개의 수강평

  • easonjung1977님의 프로필 이미지
    easonjung1977

    수강평 1

    평균 평점 4.0

    4

    100% 수강 후 작성

    Overall, it was a good course. I studied Pandas on my own with a book and applied for this course for the purpose of repeated learning and application of Pandas. The Pandas cheat sheet course was actually not that great. It won't be of much help to those who are new to Pandas, new to Python, or very beginners. It's okay as a YouTube video, but it's a bit disappointing as a paid lecture. The Seoul City Corona Analysis course was good. It was a very useful part for me who studied the basics of Pandas because I was able to practice how to process data by applying Pandas to obtain the desired form and results. And the tips given here and there were also very helpful. Like shift-tab, or using ? after a function to see the dot string... I think these are great tips... Summary in one line: I don't recommend it to those who are just starting out with Pandas, but I highly recommend it to those who know a little about Pandas.

    • flyhigh님의 프로필 이미지
      flyhigh

      수강평 1

      평균 평점 5.0

      5

      37% 수강 후 작성

      It's a good curriculum. Even a beginner like me could see the operating principles and results at the same time. What I like the most is the Q&A part. If there's something you don't know, you can ask the teacher questions and get answers right away. And the teacher's voice has such a good wavelength that it's easy to concentrate.

      • wonseok님의 프로필 이미지
        wonseok

        수강평 15

        평균 평점 4.7

        5

        89% 수강 후 작성

        As a beginner, I think this is a great lecture that will help you learn the overall concept of Pandas and learn thoroughly how to use it for actual analysis. I have taken several lectures on Pandas, but I think this is the only lecture that explains the details one by one with such quality. I will review it again and apply it to actual business data and analyze it. Thank you so much for making such a great lecture!!

        • ptr81903298님의 프로필 이미지
          ptr81903298

          수강평 1

          평균 평점 5.0

          5

          100% 수강 후 작성

          After graduating from the Department of Statistics and working as a data analyst, I quit my job and am studying data analysis using Python through Park Jo-eun's lecture. It was interesting to follow the lecture because it was easy to understand using timely data rather than obvious example data. I also watch YouTube a lot. Thank you!

          • eypark1465님의 프로필 이미지
            eypark1465

            수강평 1

            평균 평점 5.0

            5

            89% 수강 후 작성

            I want to make your analysis method mine. Thank you.

            • Are you greedy?

          박조은님의 다른 강의

          지식공유자님의 다른 강의를 만나보세요!

          비슷한 강의

          같은 분야의 다른 강의를 만나보세요!

          ₩45,100