ํ๋ก๊ทธ๋๋ฐ์ ํ ๋ฐ์ง ๋ค๊ฐ๊ฐ๊ณ ์ถ๋ค๋ฉด?
ํ์ด์ฌ & ํ๋ค์ค๋ก ์ฝ๊ณ ๋น ๋ฅด๊ฒ!
์ฝ๋ฉ, ๋ฐฐ์์ ์ ์จ๋จน๊ณ ํ
์ฌ๋ฌ๋ถ์ ์ํด!
๐ก ํ์ ๊ณผ์ ์ ๊ธฐ๋ํด์ฃผ์ธ์!
๋ณธ ๊ฐ์๋ ํ์ด์ฌ(Python)๊ณผ ํ๋ค์ค(Pandas) ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๊ธฐ์ด๋ฅผ ์ตํ ์ ์๋ ๊ฐ์์
๋๋ค
ํ๋ก๊ทธ๋๋ฐ์ ์ฒ์ ์ ํ๊ฒ ๋๋ฉด ๊ทธ ๋ฐฉ๋ํ ํ์ต๋์ ์ด๋ ค์์ ๋๋ผ๊ฒ ๋ฉ๋๋ค. ์
๋ฌธ์ ์
์ฅ์์๋ ์ค์ ๊ณ ๊ธ ๋ฌธ๋ฒ, ์์ํ ๋ฉ์๋๋ค๊น์ง ์ธ์ฐ๋ฉฐ ํ์ตํ ํ์์ฑ์ ์์ต๋๋ค. ์ฐ์ ํต์ฌ ์์ฃผ๋ก ์ตํ๊ณ ๋ํ
์ผ์ ํ๋ก์ ํธ๋ฅผ ์งํํ๋ฉฐ ์ํ์ฐฉ์ค๋ฅผ ํตํด ๋ฐฐ์ฐ๋๊ฒ ํจ๊ณผ์ ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
ํ์ด์ฌ์ ํนํ๋ ์คํ ์์ค๊ฐ ๋ง๊ณ ๋ฌธ๋ฒ์ด ๋น๊ต์ ์ฝ๊ณ ๊ฐ๋จํ๊ธฐ ๋๋ฌธ์ ๋น ๋ฅด๊ฒ ์ตํ๊ณ ์จ๋จน๊ธฐ ์์ฃผ ์ข์ ์ธ์ด์
๋๋ค. ์ผ๋จ ํ์ด์ฌ์ ์ตํ๋๊ณ ๋๋ฉด ์ฌ๋ฌ๋ถ๋ค์ด ๋ง๋ค๊ณ ์ถ์ ํ๋ก๊ทธ๋จ ์ ์์ ํ ๋ฐ์ง ๊ฐ๊น์์ง๊ฒ ๋๋ ๊ฒ์ด์ฃ .
๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ถ์์ ํนํ๋ ํ๋ค์ค(Pandas) ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ตํด ๋ด
๋๋ค.
ํ๋ก๊ทธ๋๋ฐ์
์ฒ์ ์ ํ์๋ ๋ถ
ํ์ด์ฌ ํ๋ก๊ทธ๋๋ฐ ๋ฌธ๋ฒ + ํ๋ค์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ
ํต์ฌ ์์ฃผ๋ก ๋น ๋ฅด๊ฒ ์ตํ๊ณ ์ถ์ ๋ถ
์ด ๊ฐ์์์ ๋ฐฐ์ฐ๊ฒ ๋ ํ๋ค์ค๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ํนํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์
๋๋ค. ์ฝ๊ฒ ๋น์ ํ๋ฉด ์ฐ๋ฆฌ๊ฐ ๋ง์ด ์ฐ๋ ์์
(Excel)์ ํ์ด์ฌ ๋ฒ์ ์ด ๋ฐ๋ก ํ๋ค์ค๋ผ๊ณ ํ ์ ์์ฃ . ํ๋ค์ค๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ ๋ฌผ๋ก , ๋ถ์์ ํ์ํ ๊ฐ๋จํ ์๊ฐํ๊น์ง ์ฝ๊ณ ํธ๋ฆฌํ๊ฒ ํ ์ ์๊ฒ ๋ฉ๋๋ค.
ํ๋ก๊ทธ๋๋ฐ ์ธ์ด ๊ธฐ์ด ๋ฌธ๋ฒ๋ง ์ค์ฐฝ ๋ฐฐ์ฐ๋๋ผ ๋ต๋ตํ์ง ์์๋์?
์ฝ๋ฉ์ ๋ฐฐ์ฐ๊ณ ์ถ์ง๋ง ๋ง์ ์ด๋ป๊ฒ ์จ๋จน์์ง ๋ชฐ๋ผ ๋ง์ค์ด์
จ๋์?
์ด๋ฒ ๊ฐ์๊ฐ ํ๋ก๊ทธ๋๋ฐ์ ์ฒ์ ์
๋ฌธํ๋ ๋ถ, ํ์ด์ฌ์ผ๋ก ๋ฐ์ดํฐ ๊ด๋ จ ์
๋ฌด๋ฅผ ์์ํ์๋ ๋ถ๋ค๊ป ์ ์ฉํ ์ฐธ๊ณ ์๋ฃ๊ฐ ๋ ์ ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
๋๊ตฌ๋ ์ฝ๊ฒ ํต์ฌ๋ง
๋ฐฐ์ธ ์ ์๋๋ก ๊ตฌ์ฑํ์ด์.
์งง์ง๋ง ๊ฐํ๊ฒ!
์ฐจ๊ทผ์ฐจ๊ทผ ์ตํ๋ ํ์ด์ฌ ๊ธฐ์ด
๋ณ์, ์กฐ๊ฑด, ๋ฐ๋ณต, ํจ์ ๋ฑ
ํ์ด์ฌ ํ๋ก๊ทธ๋๋ฐ์ ํ์ํ
๊ธฐ๋ณธ ๋ฌธ๋ฒ์ ์์งํ๊ณ ,
ํ์ฉํ ์ ์๊ฒ ๋ฉ๋๋ค.
๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ
ํ๋ค์ค์ ํต์ฌ
ํ๋ค์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ํต์ฌ ์๋ฃํ
Series, DataFrame์
CRUDํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ฐฐ์ฐ๊ณ ,
ํ์ฉํ ์ ์๊ฒ ๋ฉ๋๋ค.
๊ณง๋ฐ๋ก ์จ๋จน์ ์ ์๋
ํ๋ค์ค ํ์ฉ ๋ฅ๋ ฅ
ํ๋ค์ค๋ฅผ ํ์ฉํด ๋ฐ์ดํฐ๋ฅผ
ํ์ํ ํํ๋ก ๊ฐ๊ณตํ๊ณ ,
๊ธฐ๋ณธ์ ์ธ ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ
ํ ์ ์๊ฒ ๋ฉ๋๋ค.
ํ์ด์ฌ ๊ธฐ์ด
ํต์ฌ ๋ฌธ๋ฒ
- ํ์ด์ฌ ์ค์น, ์ฃผํผํฐ ๋
ธํธ๋ถ(Jupyter Notebook) ์ฌ์ฉ๋ฒ
- DataType & Variables
- Condition
- Loop
- Function
- ํ์ด์ฌ ํ๋ก๊ทธ๋๋ฐ ์ฐ์ต ๋ฌธ์
ํ๋ค์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ
ํต์ฌ ๊ธฐ์ด
- Pandas, Numpy ์ค์น
- DataFrame CRUD
- Pandas Calculation Methods
- Appy
- Concat
- Handling Duplicated Data
- Handling Missing Data
- Simple Visualization
- ํ๋ค์ค ์ฐ์ต ๋ฌธ์
ํ์ด์ฌ ์กฐ๊ฑด๋ฌธ์ ๋ํ ์ดํด
ํ๋ค์ค ๋ฐ์ดํฐํ๋ ์์ ํ์ฉํ ๊ฐ๋จํ ๋ฐ์ดํฐ ์๊ฐํ
Q&A ๐ฌ
Q. ๋น์ ๊ณต์๋ ์๊ฐํ ์ ์๋์?
๋ค! ํ์ด์ฌ, ํ๋ค์ค ์
๋ฌธ ๊ฐ์์
๋๋ค. ์ด ๊ฐ์๋ฅผ ์๊ฐํ์๊ณ ๋ ๋ค, ์ด ๊ฐ๋
์ ํ์ฉํ ์ ์๋ ์์ ํ๋ก์ ํธ๋ฅผ ์งํํด๋ณด์๋ ๊ฒ์ ์ถ์ฒ๋๋ ค์. ํ ์ธ์ด์ ๋ฌธ๋ฒ์ ๊ณต๋ถํ ๋ค ํด์ผํ ์ผ์ ๋ค๋ฅธ ์ธ์ด๋ฅผ ๋ฐฐ์ฐ๋๊ฒ ์๋๋ผ ํ์ฉํด๋ณด๋ ์ผ์
๋๋ค. ์ข
์ข
์
๋ฌธ์ ์ค ์ธ์ด ์ ๋ชฉ๋ฏผ์ฒ๋ผ ์ธ์ด ๋ฌธ๋ฒ๋ง ์ฃผ๊ตฌ์ฅ์ฐฝ ๋ฐฐ์ฐ์๋ ๋ถ๋ค์ ๋ณด๋ฉด ๋งค์ฐ ์ํ๊น์ต๋๋ค ใ
ใ
๊ตฌ๊ธ์ "ํ์ด์ฌ ํ์ฉ ํ๋ก์ ํธ"๋ผ๊ณ ๊ฒ์ํ์ ๋ค ๊ฐ์ฅ ์ฌ๋ฐ๊ณ , ํด ๋ณผ ๋งํ ํ๋ก์ ํธ๋ฅผ ์๋ํด๋ณด์ธ์. ์ ์ญ์ ํ์ด์ฌ์ผ๋ก ํ๋ก๊ทธ๋๋ฐ์ ์
๋ฌธํ์ฌ ์น, ์๋ฒ๊น์ง ์ตํ๊ฒ ๋์์ต๋๋ค!
Q. ์ ํํ ํ์ด์ฌ์ ๋ฐฐ์์ผ ํ๋์?
์ฒซ์งธ, ํ์ด์ฌ์ ๋ค๋ฅธ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด ๋๋น ํ์ต ์ง์
์ฅ๋ฒฝ์ด ๋ฎ์ ํธ์
๋๋ค. ํ ๊ฐ์ง ์ธ์ด๋ฅผ ๋ฐฐ์ฐ๊ณ ๋ ๋ค์ ๋ค๋ฅธ ์ธ์ด๋ฅผ ๋ฐฐ์ฐ๋ ๊ฒ์ ํจ์ฌ ์ฝ์ต๋๋ค.
๋์งธ, ํ์ด์ฌ์ ์ ๋ง ํฌ๊ณ ์ฌ๋ฏธ์๋ ์คํ์์ค๊ฐ ๋ง์ต๋๋ค. ๊ธฐ๋ณธ๋ง ์์๋ ์งํํ ์ ์๋ ๋ฏธ๋ ํ๋ก์ ํธ๊ฐ ์ ๋ง ๋ง๋ค๋ ๋ป์ด์ฃ .
ํ๋ก๊ทธ๋๋ฐ์ ์ฒ์ ๋ฐฐ์ฐ๊ฑฐ๋, ๋ฐฐ์์ ๋ค์ํ ์์ญ์ ์ด์ฉํด๋ณด๊ณ ์ถ์ ๋ถ๋ค๊ป ๋ฐฐ์ฐ๊ธฐ ์ฝ๊ณ ํ์ฉ๋ ๋์ ํ์ด์ฌ์ ์ถ์ฒํด๋๋ฆฝ๋๋ค.
Q. ์๊ฐ์ ์ํด ์ค๋นํด์ผ ํ ๊ฒ์ด ์๋์?
์ปดํจํฐ์ ์๊ฐ๋ฝ๋ง ์์ผ์๋ฉด ๋ฉ๋๋ค! ใ
ใ
๊ฐ์์ ํ์ํ ์๋ฃ๋ ๋ชจ๋ ์ ๊ณตํด๋๋ฆฌ๋ฉฐ, ํธํ๊ฒ ๋ฐ๋ผ์ค์๋ฉด ๋ฉ๋๋ค. (๊ฐ์๋ Windows OS ๊ธฐ์ค์ผ๋ก ์งํ๋ฉ๋๋ค.)