이런 걸
배워요!
판다스로 데이터를 가공하기
판다스를 활용한 분석과 시각화
문제풀이로 판다스 숙련도 높이기
데이터 분석을 위한 판다스(Pandas),
공식 문서로 탄탄하게 익혀보세요!
파이썬 라이브러리, 판다스를 이용해
데이터 분석을 쉽고 편리하게 해볼 수 있어요.
데이터 분석가가 파이썬으로 분석을 한다면, 보통 판다스(Pandas) 라이브러리를 불러오는 일을 가장 먼저 할 거예요. 시각화, 머신러닝, 통계모델 적용 등 어떤 분석 작업을 하든 데이터를 적합한 형태로 가공하는 ‘전처리’ 과정이 선행되어야 하는데요. 이렇게 데이터를 다루는 데에 가장 특화되어 있고, 그래서 가장 널리 사용되고 있는 라이브러리(패키지)가 바로 판다스입니다.
파이썬 데이터 분석의 필수 과목 판다스, 데이터리안과 함께 입문해 봐요!
코딩을 할 때 ‘구글링이 필수’라는 말에 모두들 동의하실 거예요. 웹에는 정보를 얻을 수 있는 문서가 정말 많지만, 그중에서도 가장 좋은 것은 공식 문서입니다. 정확한 용어와 활용법을 제시하고 있기 때문이죠. 이미 판다스를 능숙하게 사용하고 있는 사람들도 공식 문서를 보고 ‘이런 좋은 기능이 있었어?’ 하며 놀라기도 합니다.
이제 판다스를 시작하는 여러분은, 처음부터 최고의 교과서인 공식 문서로 차근차근 배워나가 보는 건 어떨까요? 저희 강의는 이 여정을 돕는 익힘책 같은 역할을 할 거예요. 공식 문서를 함께 읽고, 예시 코드도 함께 따라 쳐 보고, 추가적인 설명을 덧붙이는 방식으로 학습이 진행됩니다.
판다스가 다루는 데이터는 ‘2차원 데이터프레임’입니다. 2차원 데이터프레임이라고 하니까 낯설겠지만, 사실은 여러분이 이미 잘 아시는 개념이에요. 엑셀과 같은 스프레드시트에서 많이 본 표 모양의 데이터를 생각하시면 됩니다. 만약 SQL의 테이블을 알고 계신 분이라면 더 잘 와닿을 거고요.
같은 형태의 데이터를 다루는 도구이다보니 판다스에서도 SQL, 엑셀과 비슷한 기능, 또는 비슷하지만 더 강력한 기능을 제공하는 경우가 많아요. 그래서 새로운 함수를 배울 때 SQL 또는 엑셀과 비교하는 내용을 담았습니다. 이미 아는 것과 비교하면서 학습하면 더 쉽고 빠르게 이해하실 수 있겠죠?
SQL로 할 수 있는 것 보다 좀 더 심화된 분석 & 시각화를 해보고 싶어서 파이썬을 시작하시는 분, 엑셀에서 다 불러올 수 없는 대용량 데이터를 다루기 위해 판다스가 필요하신 분 등 다른 도구를 이미 활용하고 계신 분들에게 도움이 되는 강의입니다.
Q. SQL, 반드시 알고 들어야 하나요?
SQL 학습을 먼저 시작해보시기를 추천드리지만, 엑셀을 다뤄보셨다면 강의를 이해하는데 크게 어려운 내용은 없을 거라고 생각됩니다 :)
행과 열을 가진 테이블 형태의 데이터를 다룬다는 점에서 엑셀, 판다스, SQL은 모두 비슷한 툴입니다. 지원하는 기능들도 매우 비슷합니다. 강의에서 같이 보는 공식 문서 또한 파이썬 이외에 다른 언어에 대한 사전 지식을 요구하지 않습니다. 공통 키를 이용한 두 테이블 간의 연결, 그룹별 연산 등 데이터 테이블을 다루면서 SQL과 공통적으로 나오는 개념들에 대한 설명은 영상에서 일부 생략되어 있지만 영상 하단에 보충 자료를 드립니다. 샘플 강의를 시청해보시고 ‘할 만한데?’ 라고 생각하셨다면 충분합니다.
백문이 불여일타! 배운 것은 많이 써 봐야 늡니다. 학습한 문법이 어떤 상황에서, 어떤 작업을 위해 쓰는 건지를 확실히 습득하고 손에 익히는 시간을 가집니다.
하나의 섹션이 마무리되면 그 섹션에서 배운 함수를 연습할 수 있는 문제의 목록을 드립니다. 강의는 잠깐 멈춰놓고, 해당 문제를 풀며 복습하시기를 권합니다. 그리고 섹션의 마지막 강의인 ‘문제 풀이’ 영상에서 풀이 과정을 함께 나누는 시간을 가져요. 마지막 섹션은 이제까지 배운 모든 것을 종합해서 푸는 문제들로 구성되어 있으니, 끝까지 달려 봅시다!
판다스를
체계적으로
이해하고 싶은 분
문제풀이와 함께
판다스를
공부하고 싶은 분
SQL을 사용하면서
파이썬으로 분석 영역을
넓히고 싶은 분
엑셀 등 스프레드시트를
사용해 봤고
판다스를 배우고 싶은 분
강의에서 사용할 플랫폼인 구글 코랩(Google Colaboratory, Colab)에 대해 알아보고 판다스 공식 문서를 순차적으로 학습해 봅니다. 판다스로 데이터를 불러오고 저장하기 위해서는 어떤 과정을 거쳐야 하는지 알아보고, 특정 컬럼(Column, 열)과 로우(Row, 행)를 선택하는 방법에 대해 학습합니다.
판다스를 통해 데이터의 추세와 흐름을 파악할 수 있도록 간단한 시각화를 진행해 봅니다. 여기에 기존 컬럼들이 가지고 있는 값끼리 연산하여 새로운 컬럼을 만들고, 필요한 연산을 처리하고, 데이터를 집계하고 규모를 파악하는 방법까지 배울 수 있게 됩니다.
테이블을 변형/정렬하고, 구글 스프레드시트와 연계하여 데이터를 피봇 테이블(Pivot Table) 형태로 만드는 법에 대해 알아봅니다. 아울러 여러 테이블의 로우를 연결하고, 공통 컬럼을 사용해 여러 개의 테이블을 결합해 봅니다.
시계열 데이터(Time Series Data), 문자열 데이터(Textual Data)를 다루는 방법에 대해 알아봅니다. 여기에 정규표현식을 활용하여 특정 패턴을 찾아내는 방법까지 다루게 될 거예요.
학습 대상은
누구일까요?
판다스를 체계적으로 이해하고 싶은 분들
문제풀이와 함께 판다스를 공부하고 싶은 분들
현재 SQL을 사용하고 있고 파이썬으로 분석 영역을 넓히고 싶은 분들
엑셀 등의 스프레드시트를 사용해 봤고 판다스를 배우고 싶은 분들
선수 지식,
필요할까요?
기초 파이썬 (list, dict 등 자료구조에 대한 이해)
전체
56개 ∙ (6시간 25분)
가 제공되는 강의입니다.
판다스 연산 맛보기 (06:48)
06:48
데이터를 읽고 확인하기 (18:11)
18:11
특정 컬럼 선택하기
10:41
특정 로우 선택하기
13:21
특정 컬럼과 로우 선택하기
11:21
(더 알아보기) Null
13:17