데이터 사이언스

/

데이터 분석

캐글 설문조사로 데이터 분석 입문하기

캐글은 어떤 플랫폼일까요? 해마다 캐글에서는 전세계 사용자를 대상으로 설문조사를 합니다. 데이터 사이언스를 배우고자 할 때 여러 궁금증이 생깁니다. 지금 시작하기에 너무 늦지는 않았을까? Python과 R 중에 어떤 언어를 선택해야 할까? 급여는 어느 정도일까? 전세계 사용자의 응답을 통해 궁금증을 해소해 보세요! Pandas의 강력한 몇 가지 기능만으로 빈도수 분석과 데이터 시각화를 할 수 있습니다.

(4.9) 수강평 91

수강생 3,140

Thumbnail

초급자를 위해 준비한
[데이터 분석] 강의입니다.

이런 걸
배워요!

  • kaggle notebook 사용법

  • pandas로 DataFrame과 Series 형태의 데이터 다루기

  • pandas의 loc를 통한 데이터 인덱싱

  • pandas value_counts로 빈도수 계산하기

  • seaborn countplot으로 빈도수 시각화하기

  • seaborn barplot으로 막대그래프 그리기

  • pd.crosstab으로 여러 질문에 대한 응답값 빈도수 구하기

  • sort_index()와 sort_values()로 데이터 정렬하기

  • pandas filter 사용법

데이터로 파헤치는 캐글러의 비밀!
이제, 데이터 분석의 첫발을 내딛어보세요.

전세계 캐글러들은 어떤 생각을 하고 있을까요?

데이터 분석가, 데이터 사이언티스트,
머신러닝 엔지니어가 되고 싶은데...
딱히 물어볼만한 곳도 없고, 궁금한 건 많다면?!

데이터를 통해 분석해 보세요!

  • 아마 고민 해결에 조금 도움이 될 수도 있을 것 같아요.
  • 데이터 입문자들의 앞에 여러 선택의 길이 있습니다.

무엇을 선택해야 될지 고민이 된다면?

데이터 속에 답이 있을지도 몰라요!

Python vs R vs SQL

scikit-learn vs TensorFlow

Matplotlib vs Seaborn vs Plotly vs ggplot

Jupyter vs VS Code vs PyCharm

AWS vs MS Azure vs GCP

데이터 사이언스를 시작하기에 너무 늦지 않았을까요?

👉 캐글러의 성별과 연령대는 어떻게 될까요?

캐글러는 주로 어느 지역에 살고 어떤 직업군에 종사하고 있을까요?

👉 데이터 분석가? 사이언티스트? 머신러닝 엔지니어? 프로그래머?

캐글 유저는 주로 어떤 언어를 사용하고 입문용 언어를 추천한다면 어떤 언어를 추천할까요?

👉 Python vs R vs SQL?
👉 주피터? VS Code? PyCharm? 어떤 편집기를 사용해야 할까요?
👉 연령대별로 캐글러의 성별 비율은 달라질까요?
👉 또, 성별에 따라 사용하는 언어, 직업군에 차이가 있을까요?

단순한 빈도 분석을 통해 캐글러의 관심사와 인구통계학적 정보를 알아봅니다.

또 같은 작업을 반복해서 해야 한다면? 함수를 만들어 반복된 작업을 줄여봅니다. 
질문 번호만 넘겨주면 알아서 빈도수를 분석해보는 함수를 만들어 볼 거예요!

별도의 설치와 다운로드 없이 캐글 로그인만으로 실습을 진행해 보세요!

⚠️ 수강 전 유의사항

  • 파이썬이나 판다스 기초는 수업하지 않고 바로 분석을 진행합니다.
  • 파이썬, 판다스, 시각화 사용법은 자세히 다루지 않습니다.
  • 오직 설문 분석을 위한 몇 가지 스킬만을 다룹니다.
  • 파이썬, 판다스, 시각화 기초가 아예 없다면 수강에 어려움이 있을 수도 있어요.
  • 39가지 문항에 대한 응답을 직접 코드로 확인하고 어떻게 하면 간단하게 분석해 볼 수 있을까에 대한 스킬만을 다룹니다.

관련 로드맵

뼈문과를 위한 파이썬(Python) 현실 데이터 분석 
실제 업무에 활용 가능한 데이터 사이언스 로드맵!
  이 강의 포함 

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 데이터 사이언스 입문자

  • 캐글 입문자

  • 다른 데이터 분석가의 인구통계학적 정보가 궁금한 분

  • 판다스로 설문 분석을 하고자 하는 분

  • 데이터 분석가

  • 데이터 전처리 기법을 익히고자 하는 분

선수 지식,
필요할까요?

  • python의 데이터타입, 변수, 리스트, 조건문, 함수에 대한 기본 이해

  • python의 비교연산과 할당연산

  • pandas의 DataFrame과 Series 형태에 대한 기본 이해

  • 막대그래프에 대한 이해

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

커리큘럼

전체

13 ∙ 2시간 40분

강의 게시일: 2021년 01월 06일
마지막 업데이트일: 2021년 01월 06일

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!