데이터 사이언스

/

데이터 분석

데이터 과학을 위한 파이썬 NumPy Basic

데이터 과학 분야의 대표적인 라이브러리인 파이썬 NumPy에 대해서 배웁니다. NumPy를 배우고 데이터 과학 학습의 초석을 다져보세요!

(4.9) 수강평 84개

수강생 3,276명

Thumbnail

초급자를 위해 준비한
[데이터 분석, 프로그래밍 언어] 강의입니다.

이런 걸
배워요!

  • 파이썬 Numpy 라이브러리

  • 파이썬 배열 데이터 연산

  • 선형대수 수치 연산

다차원 배열을 쉽게 처리해주는 NumPy로
데이터 과학의 첫걸음을 떼보세요!

강의 주제 📖

NumPy(넘파이)?

대규모 다차원 배열을 다루는 파이썬 라이브러리, NumPy! 
빠른 연산 속도로 대규모 데이터를 처리할 수 있습니다.

NumPy는 파이썬 Pandas, SciPy, Matplotlib, Pytorch 등과 함께 데이터 과학과 머신러닝, 딥러닝 운용의 기반이 되는 대표적인 파이썬 라이브러리입니다.

파이썬에서 대규모의 다차원 배열, 그리고 행렬 데이터 처리를 위한 수치 연산을 가능하게 하며 내부적으로 C언어로 구현이 되어있기 때문에 메모리를 최소한으로 유지하고 관리하면서 동시에 연산 속도도 매우 빠른 라이브러리 중 하나입니다.

그렇다면 다차원 배열을 왜 쓰는 것일까요?

다차원 배열(ndarray)?

다차원 배열이란 배열 요소로 
또 다른 배열을 가지는, 
2차원 이상의 배열을 의미합니다.

데이터를 처리할 때 데이터는 숫자들의 배열로 이루어져 저장됩니다. 위와 같은 이미지를 처리할 때 전체 이미지는 2차원 배열 데이터로 구성되어 있으며 이미지의 픽셀 하나하나가 0부터 255까지의 숫자 데이터로 처리하게 되어있습니다. 이렇게 데이터를 배열로 구성하는 것은 데이터를 처리하는 가장 기본이 되는 절차이기 때문입니다.


강의 구성과 진행 방식 🎢

데이터 과학 분야의 파이썬 개발 환경인 Google Colab에서 실습을 진행합니다.

7개의 섹션, 총 30여강에 걸쳐 진행되며 각 섹션별, 주제별로 NumPy 모듈에서 사용할 수 있는 함수들을 간단한 예시와 함께 다룹니다. 처음에는 예시를 작성한 코드를 직접 따라서 작성하시고 나중에 실습용 파일을 이용하여 그날 복습을 완전히 끝냅니다. (실습용 파일은 아래에서 설명 드리겠습니다)

어렵고 생소한 선형대수 개념들은 자료를 통해 추가로 학습합니다.

마지막 섹션에서는 배운 이론과 함수들을 바탕으로 제작된 예제를 함께 풀어보며 파이썬과 NumPy 라이브러리의 코드 작성 실력을 강화합니다. (실습 예제는 차후 추가될 수 있습니다)


강의를 100% 활용하는 방법 ✨

구글 드라이브에 올려드린 실습용 파일을 다운로드합니다. 

상단 네비게이션 바에서 파일 - 드라이브에 사본 저장을 누르시면 여러분의 드라이브에 저장이 되는데 이 때 파일명의 끝부분이 '~실습용_yjglab.ipynb의 사본' 으로 저장됩니다. 파일 명에서 파일 형식을 제외한 '의 사본' 부분을 지우시고 파일을 사용하시면 됩니다. 

이 파일에는 강의를 진행한 Section들과 소주제들이 표시되어 있습니다.
강의를 수강한 후 그날 배운 것을 바탕으로 자신이 직접 주제에 맞는 코드들을 작성해보세요.
예를 들어, 오늘 Section 2의 A함수와 B함수에 대해서 배웠다면 직접 이론을 보지 않는 상태에서 각각의 함수에 대한 예제를 작성하시는 겁니다.

기억이 나지 않아도 괜찮습니다. 최대한 자신이 아는 만큼 적어보고 부족했던 부분의 강의 내용을 복습하며 자신이 작성한 코드의 사용 예제가 배운 내용과 일치하는지 확인합니다.

선수 지식을 확인해주세요!

  • 변수, 리스트, 튜플, 반복문, 조건문 등 파이썬(Python) 기초 문법을 알고 계셔야 합니다.

학습 내용 📚

Section 0. NumPy 시작

NumPy에 대한 간단한 소개를 시작으로 파이썬 실습환경을 구성한 후 N차원 배열의 기본적인 개념인 배열과 축, 차원, 행렬, 텐서를 다룹니다.

Section 1. N차원 배열(ndarray) 생성

여러가지 형식으로 N차원 배열을 생성하는 방법과 데이터 타입, 그리고 간단하게 데이터를 시각화하는 방법을 다룹니다.

Section 2. N차원 배열의 인덱싱

배열의 index를 이용해 값에 접근하는 방법과 특정 범위의 값들을 탐색하는 방법을 다룹니다.

Section 3. N차원 배열의 연산법

행렬의 사칙 연산, 내적 연산, 비교 연산 등 기본적인 연산법과 브로드캐스팅 연산 과정을 다룹니다.

Section 4. N차원 배열 정렬

배열의 원소들을 대소관계에 따라 정렬하는 방법을 다룹니다.

Section 5. N차원 배열의 형태 변경

배열의 shape을 변형하고 차원을 확장, 축소하는 방법을 다룹니다.

Section 6. N차원 배열의 병합

배열에 원소를 추가하고 삭제하는 방법과 데이터를 병합하고 분할하는 방법을 다룹니다.

Section 7. 실습 예제

배운 내용을 바탕으로 실습 예제를 풀어봅니다.


예상 질문 Q&A 💬

Q. 파이썬을 전혀 몰라도 들을 수 있나요?

파이썬 문법 중 변수, 리스트, 튜플, 반복문, 조건문에 대한 이해가 있으시면 강의를 원활히 보실 수 있습니다!

Q. 선형대수학을 몰라도 들을 수 있나요?

함수를 설명하는 차원에서 꼭 필요하다고 생각되는 기초적인 선형대수 개념들은 설명드리지만 그 외의 내용은 다루지 않았습니다!

Q. 비전공자도 들을 수 있나요?

위 두 질문의 답변에 대한 내용만 숙지하신다면 무리없이 들으실 수 있습니다!

Q. 강의를 듣기 전 준비해야 할 것이 있나요?

Google Chrome 브라우저 사용을 권장하며 Colab 개발 환경을 사용하기 위해 Google 계정에 로그인 되어 있으셔야 합니다!

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 파이썬을 막 시작하신 분

  • 파이썬으로 행렬 데이터를 다뤄보고 싶으신 분

  • 데이터 과학 입문자분

선수 지식,
필요할까요?

  • Python3 기초 문법 (변수, 리스트, 튜플, 반복문, 조건문 등)

안녕하세요
yjglab입니다.

컴퓨터공학과 시각디자인학을 전공한 평범한 개발자입니다. 데이터를 이용한 여러가지 개인 웹 서비스를 개발하고 운영하고 있습니다.

커리큘럼

전체

31개 ∙ (2시간 56분)

강의 게시일: 
마지막 업데이트일: 

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!