実践データサイエンス Part 3. 機械学習の理解
hjkim3
企業のデジタル変換(DT)、人工知能(AI)の導入は、機械学習モデルの構築から始まります。ただし、機械学習技術の範囲は非常に広く、最適な方法を選択するには基本的な概念を明確に理解する必要があります。この講義では、機械学習の基本概念を明確に理解するために必要な重要な内容を5つの例を中心に紹介します。
초급
Machine Learning(ML)
데이터분석, 머신러닝 모델을 구현하기 위한 파이썬 핵심 기능
데이터를 다루고 파일 입출력을 처리하는 기본기
핵심만 담았다!
데이터 분석을 위한 필수 파이썬
빅데이터 분석, 머신러닝, 딥러닝, 인공지능, 디지털전환(DT) 등, 최근 가장 수요가 많은 기술 분야입니다. 거의 모든 산업에서 이러한 기술을 담당할 데이터 사이언티스트 양성이 가장 중요하고 시급한 상황입니다.
데이터 사이언티스트가 되기 위해서는 무엇보다 파이썬을 자유자재로 사용할 수 있어야 합니다. 그러나 파이썬을 익히는데 너무 많은 시간이 소요되어 초반에 포기하는 경우도 많습니다.
이 강의에서는 현장에서 실제로 데이터 분석, 머신러닝 모델 작업을 수행하는 데 필요한 파이썬의 기본적이며 핵심적인 내용을 중점적으로 다룹니다. 초보적인 내용을 상세하게 설명하지 않으며 파이썬의 많은 기능을 소개하지는 않습니다. 오직 핵심만을 담았습니다.
먼저, 파이썬 환경 실행 설정으로 주피터 노트북 사용법과 깃허브 사용법을 배웁니다. github 사용법에서는 소스코드 위치를 공유하오니 함께 따라 해보며 공부해보세요.
본격적인 파이썬 기초로 숫자, 문자열, 불리언 변수를 다루는 것과 여러 개의 데이터를 묶어서 처리하기 위한 리스트, 튜플, 딕셔너리의 차이점과 특징을 배웁니다. 프로그램의 흐름을 관리하는 if, for, while의 동작을 배웁니다.
다음에는, 판다스 패키지가 제공하는, 2차원 테이블 구조인 데이터프레임의 조작법 (데이터 검색, 추가, 삭제 등)을 배우고, 넘파이가 제공하는 매트릭스(배열)의 수치 연산 방법을 다룹니다.
데이터의 시각화를 다루며, 대표적인 시각화 기법으로 plot, scatter, hist, boxplot, bar 그래프 사용법과 특징을 소개합니다.
파이썬의 가장 큰 장점은 "데이터에 함수를 편리하게 적용"하는 것입니다. 여러 가지 함수 적용 방법과 lambda, map, apply의 차이점을 배웁니다.
문제 해결을 위해 파이썬을 공부하는 분 중 파이썬의 어려운 이론으로 인해 포기하는 분들이 많습니다. 하지만 실제 여러분이 원하는 문제 해결을 위해서 해당 이론이 필요 없을 확률이 높습니다.
"완벽함이란 더 이상 보탤 것이 없는 상태가 아니라 더 이상 뺄 것이 없는 상태이다." 라는 생택쥐베리의 말처럼, 이 강의에서는 데이터 사이언티스트가 되기 위해 필요한 파이썬의 핵심 내용을 최소한의 분량으로 전달하고자 합니다.
본 과정을 통해서 모두 성공적인 데이터 사이언티스트로의 진입을 기대합니다.
(주)데이터사이언스랩 대표 김화종
학습 대상은
누구일까요?
자신의 업무를 해결하기 위해서 머신러닝 기술을 도입해야 하는 분
파이썬에 익숙하지 않으나 단시간에 핵심 파이썬을 숙지하고자 하는 분
선수 지식,
필요할까요?
열정
의지
호기심
917
명
수강생
77
개
수강평
11
개
답변
4.8
점
강의 평점
3
개
강의
"고장난 라디오 고칠 수 있어?"
제가 전자공학과에 입학한 후 친구로부터 받은 질문입니다. 뭐, 대답은 했습니다. "전자공학과에서는 라디오 만드는 원리를 배우는 것이지 고장난 전자제품 고치는 것은 우리 일이 아니고..."
이론으로 무장한 전문가보다 문제 해결사가 필요한 경우가 더 많습니다. 저는 실전 문제 해결이 더 중요하다고 생각합니다.
최근에는 머신러닝으로 금융, 에너지, 전자, 중장비, 물류, 신약개발, 식품 등 산업 영역의 문제를 해결하는 일을 하고 있는데, 정말 배울 것도 많고 할 일도 무궁무진한 영역인 것 같습니다. 본업은 교수지만 (강원대 컴퓨터공학과), 현장의 문제해결에 관심이 많아 여러 겸직을 하고 있습니다. AI신약개발지원센터장, KAIST 겸임교수, 그리고 데이터사이언스랩 대표를 맡고 있습니다.
AI 시대에 가장 필요한 인재는 실전 문제를 해결할 수 있는 데이터 사이언티스트라고 믿으며 여러분 모두 인기 있는 데이터 사이언티스트가 되기를 바랍니다.
전체
23개 ∙ (5시간 0분)
1. 강의소개
01:46
2. 쥬피터 노트북 사용법
10:19
3. github 사용법
03:46
5. 숫자와 문자열
23:05
6. 불리언 변수
07:03
7. 리스트와 튜플
16:34
8. 딕셔너리
06:57
10. 데이터프레임 기본 특성
19:08
11. 데이터프레임 작업
18:29
12. 데이터프레임 저장
17:47
전체
29개
4.9
29개의 수강평
수강평 1
∙
평균 평점 5.0
5
必要な内容だけを簡単に説明して全く難しくなく、 忘れていた基本概念を再び復旧するのに大きな助けになりました。
簡単に説明しようとしましたが幸いです。基本概念を体系的に整理するのに活用してください。ありがとうございます。
수강평 1
∙
평균 평점 5.0
5
プログラミングに慣れていなくても、実務に人工知能を適用するためのPythonの重要な概念を理解しやすく説明してくれて、短い講義であったにもかかわらず本当に役に立ちました! 本当に最小限の時間で最大の効率を引き出した講義だと思います!
最初の受講評ですね。迅速な評価ありがとうございます。復習しながら質問内容を歓迎します
수강평 2
∙
평균 평점 5.0
5
最近見た初心者のためのPython講義の中で最も簡単に説明してくれて理解し良かったし、基礎を固めるのに良い講義のようです。
ありがとうございます。初心者を想定して作りましたが、基本的に必ず知っておくべき内容はできるだけ盛り込もうとしました。初心者でも必須で知るべき範囲を把握するのに活用すればいいようです。
수강평 2
∙
평균 평점 5.0
5
Pythonの基礎知識がなかったにもかかわらず、開発環境の構築から機能活用に至るまで、コアが理解しやすく簡潔に伝達され、初心者の基礎を固めるのに本当に良い講義のようです。
良い評価ありがとうございます。今後の実戦問題を解決する際にも、主な内容の整理に役立つと期待しています。
수강평 1
∙
평균 평점 5.0
₩66,000