Pandas์ ํต์ฌ ๊ธฐ๋ฅ์ SQL๊ณผ ๋น๊ตํ๋ฉฐ ๋ฐฐ์๋ณด์ธ์!
๋ถ์์ ํ์ํ ๋ฐ์ดํฐ ํธ๋ค๋ง์ ํ ์ ์์ด์
๋จธ์ ๋ฌ๋์ ํ์ํ ๋ฐ์ดํฐ๋ฅผ ์ง์ ๊ฐ๊ณตํ ์ ์์ด์
์์ ๋ก ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์์ ์ ํ ์ ์์ด์
๋ฐ์ดํฐ ๋ถ์ + ์ ์ฒ๋ฆฌ๊น์ง!
๋ฐ์ดํฐ ์ญ๋, Pandas๋ก ๊ธธ๋ฌ๋ณด์ธ์.
์๋ ๋ฌธ์ฅ์ ์ฝ๊ณ ํ๋ฒ ์ฒดํฌํด๋ณด์ธ์.
๋ฐ์ดํฐ ์ปค๋ฆฌ์ด๋ฅผ ์ค๋นํ๊ณ ์ถ์๋ฐ
์์์ ์ ์ฐพ๊ณ ์์๋ค๋ฉด
SQL์ ์ด์ ์กฐ๊ธ ์๊ฒ ๋๋ฐ, ์ข๋ ๋ณธ๊ฒฉ์ ์ผ๋ก ๋ฐ์ดํฐ ์ญ๋์ ๊ฐํํด๋ณด๊ณ ์ถ๋ค๋ฉด
์์ฆ ๋ง์ด ํ๋ค๋ ๋ฐ์ดํฐ ๋ถ์,
๋ค์ด๋ณด๊ธด ํ๋๋ฐ ๋ญ์ง ์ ๋ชจ๋ฅด๊ฒ ๋ค๋ฉด
์์
๋ง์ผ๋ก ๋ถ์ํ๊ธฐ์ ๋ฐ์ดํฐ๊ฐ ๋ง์์
๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์ฐพ๊ณ ์์๋ค๋ฉด
๐ ํ๋๋ผ๋ ํด๋น๋๋ค๋ฉด, ์ง๊ธ ๋ฐ๋ก Pandas(ํ๋ค์ค)๋ฅผ ๋ฐฐ์ธ ๋์ ๋๋ค!
๋๋ ์ด ์ค์ํด์ง๋ ๋ฐ์ดํฐ ์ญ๋, ๊ทธ ์ค์ฌ์ ๋ฐ์ดํฐ ํธ๋ค๋ง์ด ์์ต๋๋ค. ๋ฐ์ดํฐ ํธ๋ค๋ง์ด๋ ๋ฐ์ดํฐ๋ฅผ ์ํ๋ ๋๋ก ๋ค๋ฃจ๋ ์คํฌ์ ๋ปํ๋๋ฐ์. Pandas๋ SQL๊ณผ ํจ๊ป ํ์ง ๋ฐ์ดํฐ ์ค๋ฌด์๋ค์ด ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉํ๋ ๋ฐ์ดํฐ ํธ๋ค๋ง ์คํฌ์ด๋ผ๊ณ ํ ์ ์์ด์.
๊ฐ๋จํ ์์
๋ฐ CSV ๋ฐ์ดํฐ๋ถํฐ
DB ๋ด์ ๋ฐ์ดํฐ๊น์ง ๋ง์๋๋ก ํธ๋ค๋งํ์ฌ
IT ์๋น์ค ๋ถ์, ๋จธ์ ๋ฌ๋ ์ธํ ๋ฐ์ดํฐ ์์ฑ ๋ฑ
์ฌ๋ฌ ๊ฐ์ง๋ก ํ์ฉํ ์ ์์ต๋๋ค.
์ด๋ฒ ๊ฐ์๋ ๋ฐฐ์์ ๋ฐ๋ก ์ฐ๋ ๋ฐ์ดํฐ ๊ฐ์ ์๋ฆฌ์ฆ์ 3๋ฒ์งธ ๊ฐ์๋ก SQL์ ์กฐ๊ธ ์ ๊ฒ ๊ฐ์ ๋ถ๋ค, ๋ฐ์ดํฐ ํธ๋ค๋ง์ ์ฒ์ ์ ํ๋ ๋ถ๋ค ๋ชจ๋ ๋ค์ ์ ์๋ Pandas ๊ฐ์๋ฅผ ์ค๋นํ์ต๋๋ค. ํจ๊ป ํ์ตํด๋ณด์ธ์!
ํ์ด์ฌ(Python) ๊ธฐ์ด๋ง ์๋ฉด ๋๊ตฌ๋ OK!
์
๋ฌด์ ๋ฐ์ดํฐ ์ญ๋์
๊ฐํํ๊ณ ์ถ์
ํ์ง ์ค๋ฌด์
(๋ง์ผํ
๊ธฐํ ๋ฑ)
Pandas๋ก
๋ฐ์ดํฐ ํธ๋ค๋ง
๊ด๋ จ ์
๋ฌด๋ฅผ
ํด์ผ ํ๋ ๊ฐ๋ฐ์
๋ฐ์ดํฐ ๊ด๋ จ
์ปค๋ฆฌ์ด๋ฅผ ์ค๋นํ๋
์ทจ์
์ค๋น์ ๋ฐ
ํ์ ์ฌ๋ฌ๋ถ
SQL์ ๊ธฐ๋ฐ์ผ๋ก
๋ฐ์ดํฐ ์ญ๋์
ํ์ฅํ๊ณ ์ถ์
๋ชจ๋ ๋ถ๋ค
์์ ๋ก ๋ค๋ฃจ๊ธฐ์๋ ๋๋ฌด ํฐ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ํด์ผ ํ ์ง ๊ณ ๋ฏผํ๋ ๋ถ๋ค, SQL์ ์ด๋ ์ ๋ ํ ์ค ์์ง๋ง Pandas๋ ์์ ์ต์ง ์์๋ ๋ถ๋ค ๋ชจ๋๋ฅผ ์ํด ๋ง๋ ๊ฐ์์ ๋๋ค.
์ฒ์ ๋ฐ์ดํฐ ๋ถ์ผ๋ฅผ ๊ณต๋ถํ๊ณ ์ผ์ ์์ํ๋ฉด์ SQL์ ์์ฃผ ์ฌ์ฉํ์ต๋๋ค. ๋๋ถ์ SQL์๋ ๊ธ๋ฐฉ ์ต์ํด์ก์ง๋ง Pandas๊ฐ ์์ ์ต๊ธฐ๊น์ง๋ ์๊ฐ๋ ์ค๋ ๊ฑธ๋ฆฌ๊ณ ์ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ์๊ธฐ๋ ์ด๋ ค์ ๋๋ฐ์, SQL์ ๊ฐ๋ ๋ค์ Pandas์ ๋์ ํด๊ฐ๋ฉฐ ์ตํ๋ฉด์ ๋ค์ ์ด์ํ๋ Pandas๊ฐ ์์ ๋ถ๋ ๊ฒฝํ์ ํ ์ ์์์ด์.
Pandas๋ฅผ ๊ธฐ๋ณธ๋ถํฐ ์ฝ๊ฒ ์ตํ ์ ์๋๋ก ๊ทธ๋์ ์ง์ ํ๋ก์ ํธ์ ์ ์ฉํ๋ฉฐ ๊ฒช์ ๋ฐฉ๋ฒ๊ณผ ๋ ธํ์ฐ๋ฅผ ๊ฐ์์ ๋ด์์ต๋๋ค. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค, ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์์ง๋์ด๋ง์ ๊ด์ฌ์ด ์๋ค๋ฉด ๋ฐ์ดํฐ ํธ๋ค๋ง์ ๊ฐ์ฅ ์ค์ํ ๊ธฐ์ด ์ค ํ๋์์. ์ฌ๋ฌ๋ถ์ด ๋ฐ์ดํฐ ํธ๋ค๋ง์ ํต์ฌ์ธ Pandas๋ฅผ ํ์ตํ๊ณ ์ญ๋์ ์ฅ์ฅ ๊ฐํํ ์ ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค ๐
๊ฐ์๋ฅผ ๋ชจ๋ ํ์ตํ๊ณ ๋๋ฉด, Pandas๋ฅผ ํตํ ๋ฐ์ดํฐ ์ ์ ๋ฅผ ํ ์ ์๋๋ก ์ปค๋ฆฌํ๋ผ์ ๊ตฌ์ฑํ์ต๋๋ค.
๊ฐ์๋ 3-Step์ผ๋ก ๋๋์ด ์งํ๋ฉ๋๋ค.
๊ฐ ๋จ๊ณ์ ๋ง๋ ์ปจ์ ์ ๋จผ์ ์ค๋ช ์ ๋๋ ค ์ ์ฒด์ ์ธ ๊ทธ๋ฆผ์ ์ก์ ์ ์๋๋ก ๋์๋๋ฆฌ๊ณ , ๊ทธ ๋ค์ ์ค์ ๋ผ์ด๋ธ ์ฝ๋ฉ๊ณผ ํจ๊ป ์ฝ๋๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ๋ฐ๋ผํ์ค ์ ์๋ ์ปค๋ฆฌํ๋ผ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค.
์น์ํ ๋ฐ์ดํฐ์ธํธ๋ก ์ฐ์์ฑ ๋ณด์ฅ
๊ธฐ์กด SQL ๊ฐ์์์ ๋ฐฐ์ ๋ ๊ฐ๋ ๊ณผ ์ ์ฌํ ๋ฐ์ดํฐ์ธํธ๋ฅผ ์ด์ด๋ฐ์ ๊ทธ๋๋ก ์ฌ์ฉํฉ๋๋ค. (์ฐ์์ฑ ๋ณด์ฅ)
๋๊ตฌ๋ ์ดํดํ ์ ์๋ ์ฌ์ด ์ค๋ช
๋ฏ์ ๊ธฐ์ ์ฉ์ด๋ฅผ ์ต๋ํ ํ์ด์ ์ค๋ช ์ ์งํํด ๋น์ ๊ณต์๋ถ๋ค๋ ๋ฌด๋ฆฌ์์ด ์ดํดํ ์ ์๋๋ก ๋์ต๋๋ค.
๊ณต์ ๋ฌธ์ ๊ธฐ๋ฐ, ํต์ฌ์ ์์ฐจ๊ฒ
๊ฐ๋ ์ ํต์ฌ๋ง! ๊ณต์ Pandas ๋ฌธ์ ๋ฐ CheatSheet ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ์งํํ์ฌ ์ ๋ขฐ์ฑ์ ๋์์ผ๋ฉฐ, ๊ผญ ํ์ํ ํต์ฌ๋ง์ ๋ด๊ณ ์์ต๋๋ค.
์ค์ ๊น์ง ์๊ฐํ์ด์
์ค์ต ์์ฃผ๋ก ์งํ๋์ด ์ค์ ๋ก ์ฝ๋ฉ์ ํ ์ ์๋ ์ญ๋์ ๋ง๋ค์ด ๋๋ฆฌ๋ ๋ฐ์ ์ง์ค๋์ด ์์ต๋๋ค.
Q. ๊ฐ์๋ฅผ ์๊ฐํ๊ธฐ ์ ์ ์ ์ง์์ด ์๋์?
๋ณธ Pandas ๊ฐ์๋ Python ๊ธฐ๋ณธ ๋ฌธ๋ฒ์ ์๊ณ ์๋ค๊ณ ์ ์ ํ๊ณ ์์ ์ด ์งํ๋ฉ๋๋ค. Python์ ๊ธฐ๋ณธ ๋ฌธ๋ฒ์ ์ตํ์ ์ผ ์์ํ๊ฒ ๊ฐ์๋ฅผ ๋ฐ๋ผ์ค์ค ์ ์๊ธฐ ๋๋ฌธ์ Python์ ๋จผ์ ์ตํ๊ณ ์๊ฐํ์๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค.
๊ทธ๋ฌ๋ Python์ ์ ํด๋ณธ ์ ์ด ์์ผ์ ๋ ๊ฐ์ ๋ด์ ๋ฑ์ฅํ๋ ์ฝ๋๋ค์ ๋ฐ๋ผ์ค๋ ๊ฒ์ ๊ฐ๋ฅํฉ๋๋ค. Pandas๋ฅผ ๋ค๋ฃจ๋ ๊ฒ์ Python ๋ฌธ๋ฒ์ ๋ค๋ฃจ๋ ๊ฒ๊ณผ๋ ๋ ๋ค๋ฅธ ๋ฌธ๋ฒ์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ธ๋ฐ์, ๊ฐ์ ๋ด Byte of Python์ด๋ผ๋ ํ์ด์ฌ ๋ฌด๋ฃ๊ต์ฌ์ ์ํ ๊ฐ์๋ฅผ ์ ๊ณตํด๋๋ฆฌ๊ณ ์์ผ๋ ํจ๊ป ์ฐธ๊ณ ํ์์ด ๊ฒฐ์ ํด๋ณด์ธ์.
Q. ๋น์ ๊ณต์๋ ์๊ฐํ ์ ์๋ ๊ฐ์์ธ๊ฐ์?
Python ์ ์ ์ง์์ด ์๊ณ , ๋ฐ์ดํฐ ๋ถ์์ ๊ด์ฌ์ด ์๋ ๋ชจ๋ ๋ถ๋ค์ด ์๊ฐ ๊ฐ๋ฅํฉ๋๋ค. ์จ๋ผ์ธ ๊ฐ์ ํน์ฑ์ ์๊ฐ์ ํ์๋ค๊ฐ ๋งํ๋ ๋ถ๋ถ์ ๋ฌผ์ด๋ณผ ๊ณณ์ด ๋ง๋ ํ์ง ์์ ์ ์๋๋ฐ์, ์ธํ๋ฐ [์ปค๋ฎค๋ํฐ]๋ฅผ ์ ๊ทน์ ์ผ๋ก ํ์ฉํด์ฃผ์ธ์. ์ต๋ํ ๋น ๋ฅธ ์๊ฐ ๋ด์ ๋์์ ๋๋ฆด๊ฒ์.
Q. SQL์ ๋ชฐ๋ผ๋ ์๊ฐํ ์ ์๋์?
SQL์ ์์๋ ๋ถ๋ค์ด SQL์ ๊ฐ๋ ์ Pandas์ ๋น๊ตํ๋ฉด์ ์๊ฐํ์ค ์ ์๋๋ก ์ ์๋์ด ์์ง๋ง, SQL์ ๋ชจ๋ฅด์๋ ๋ถ๋ค๋ ์ ํ ์๊ด์์ด ์๊ฐ์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ์ต ๋์์
๋๊ตฌ์ผ๊น์?
๋ฐ์ดํฐ ๋ถ์์ ์ํ ์ ์ Skill์ด ํ์ํ ๋ถ
๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ์์ฑ์ ์ํ ์ ์ Skill์ด ํ์ํ ๋ถ
์ ์ ์ง์,
ํ์ํ ๊น์?
Python ๊ธฐ์ด ๋ฌธ๋ฒ
3,573
๋ช
์๊ฐ์
228
๊ฐ
์๊ฐํ
38
๊ฐ
๋ต๋ณ
4.9
์
๊ฐ์ ํ์
5
๊ฐ
๊ฐ์
<๊ธฐํ์์ SQL> ์ ์ - ์ธ์ฌ์ดํธ
๋ฐ์ดํฐ ์์ง๋์ด ๋ฐ ๋ถ์๊ฐ ํ์ ์ฌ์ง ๊ฒฝํ ๋ณด์ (SSG.COM, ํฌ๋ชฝ, ๋์ด์๋ฐ๊ฒฌ)
SQL ์ถ๊ฐ ๊ฒฝํ ๋ค์ (๋ค์์ ๊ธฐ์ ๋ฐ ๊ฐ์ธ ๋์)
์ ์ฒด
57๊ฐ โ (4์๊ฐ 51๋ถ)
ํด๋น ๊ฐ์์์ ์ ๊ณต:
Pandas๋?
05:39
"Select" in Pandas
02:50
"Where" in Pandas
06:11
"Order By" in Pandas
01:02
"Group By" in Pandas
04:25