캐글은 어떤 플랫폼일까요? 해마다 캐글에서는 전세계 사용자를 대상으로 설문조사를 합니다. 데이터 사이언스를 배우고자 할 때 여러 궁금증이 생깁니다. 지금 시작하기에 너무 늦지는 않았을까? Python과 R 중에 어떤 언어를 선택해야 할까? 급여는 어느 정도일까? 전세계 사용자의 응답을 통해 궁금증을 해소해 보세요! Pandas의 강력한 몇 가지 기능만으로 빈도수 분석과 데이터 시각화를 할 수 있습니다.
이런 걸
배워요!
kaggle notebook 사용법
pandas로 DataFrame과 Series 형태의 데이터 다루기
pandas의 loc를 통한 데이터 인덱싱
pandas value_counts로 빈도수 계산하기
seaborn countplot으로 빈도수 시각화하기
seaborn barplot으로 막대그래프 그리기
pd.crosstab으로 여러 질문에 대한 응답값 빈도수 구하기
sort_index()와 sort_values()로 데이터 정렬하기
pandas filter 사용법
데이터로 파헤치는 캐글러의 비밀!
이제, 데이터 분석의 첫발을 내딛어보세요.
데이터 분석가, 데이터 사이언티스트,
머신러닝 엔지니어가 되고 싶은데...
딱히 물어볼만한 곳도 없고, 궁금한 건 많다면?!
데이터를 통해 분석해 보세요!
데이터 속에 답이 있을지도 몰라요!
👉 캐글러의 성별과 연령대는 어떻게 될까요?
👉 데이터 분석가? 사이언티스트? 머신러닝 엔지니어? 프로그래머?
👉 Python vs R vs SQL?
👉 주피터? VS Code? PyCharm? 어떤 편집기를 사용해야 할까요?
👉 연령대별로 캐글러의 성별 비율은 달라질까요?
👉 또, 성별에 따라 사용하는 언어, 직업군에 차이가 있을까요?
또 같은 작업을 반복해서 해야 한다면? 함수를 만들어 반복된 작업을 줄여봅니다.
질문 번호만 넘겨주면 알아서 빈도수를 분석해보는 함수를 만들어 볼 거예요!
학습 대상은
누구일까요?
데이터 사이언스 입문자
캐글 입문자
다른 데이터 분석가의 인구통계학적 정보가 궁금한 분
판다스로 설문 분석을 하고자 하는 분
데이터 분석가
데이터 전처리 기법을 익히고자 하는 분
선수 지식,
필요할까요?
python의 데이터타입, 변수, 리스트, 조건문, 함수에 대한 기본 이해
python의 비교연산과 할당연산
pandas의 DataFrame과 Series 형태에 대한 기본 이해
막대그래프에 대한 이해
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험