๋ณธ ๊ฐ์ข๋ ๊ฐํํ์ต์ ์ํ ์์ด ์ค๋ช ํฉ๋๋ค. ๊ฐ๋ ์ ์ฝ๊ณ ๋ถ๋ช ํ๊ฒ ๋ฐฐ์ธ ์ ์์ต๋๋ค. ๋ฟ๋ง ์๋๋ผ. ์ธ์ด ์ค ์ ์ผ ์ ๊ทผํ๊ธฐ ์ฌ์ด ํ์ด์ฌ์ผ๋ก ์์ฑํด ๋์ RLkit ๋ฅผ ์ง์ ์ฝ๋ฉํ๋ฉด์ ์ค์ ํฑํํก ๊ฒ์์ ๊ตฌํํ๊ณ ์คํํ ์ ์์ต๋๋ค.
์๋ ํ์ธ์. "๋ง๋ค๋ฉด์ ๋ฐฐ์ฐ๋ ์ธ๊ณต์ง๋ฅ(๊ฐํํ์ต ํธ) in inflearn" ์ ๊ฐ์ฌ Kwang ์ ๋๋ค.
๋จผ์ ๊ฐ์๋ฅผ ์๊ฐํด์ฃผ์ ์ ๊ฐ์ฌ๋๋ฆฝ๋๋ค.
"๋ง๋ค๋ฉด์ ๋ฐฐ์ฐ๋ ์ธ๊ณต์ง๋ฅ" ๊ฐ์๋ ์ ๊ฐ ์ํ๊ณ ๋ฅผ ๋ณด๊ณ ์ ๋ ์ ๋ฐ๊ฑธ ๋ง๋ค๊ณ ์ถ๋ค๋ ์ถฉ๋์์ ์์ํ์์ต๋๋ค. ์ฌ์ค ์ํ๊ณ ๋ ๋จ์ Q-learning ์๊ณ ๋ฆฌ์ฆ์ด ์๋ DQN(Deep Q-learning network) ๋ผ๋ ๋ด๋๋คํธ์ํฌ๋ฅผ ์ฌ์ฉํ๋ ๋ณต์กํ ๋?์ด์์ต๋๋ค. ์ ๊ฐ DQN ๊น์ง ๋ฐฐ์์ ํ๊ธฐ์ Tensorflow ์ฅ๋ฒฝ์ด ๋ง๊ฐํ์ต๋๋ค. ๊ทธ๋์ ๋จ์ Q-learning ์ผ๋ก๋ง ํฑํํก์ ํ์ต์์ผฐ์์ต๋๋ค.
์ด์ ๊ฐํํ์ต์ ๊ฝ์ธ DQN ์ ์ด์ฉํด ๋ฉ์ง ๋ ์์ ๋ง๋ค๊ธฐ ์ํด ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๊ณผ์ ์ ๊ฐ์๋ก ๋ง๋ค๊ณ ์์ต๋๋ค. ๋งํ ๊ฒ๊ณผ ๋ฐฐ์ธ ๋ด์ฉ์ด ๋๋ฌด ๋ง์ ์์ ๊ฐ์ ๋จ์๋ก ๋๋์ด ๋ง๋ค์ด ๋ณด๋ ค๊ณ ํฉ๋๋ค. ๊ทธ ์ค ์ฒซ๋ฒ์งธ ๊ฐ์ข์ธ "๋ฐ๋์ ์์์ผ ํ Tensorflow ์ํ" ๊ฐ์๊ฐ ๋์์ต๋๋ค.
Tensorflow ๋คํธ์ํฌ ํ์ต์ ๊ฒฐ๊ตญ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์คํํ๋ ๊ณผ์ ์ ๋๋ค. ๊ฒฝ์ฌํ๊ฐ๋ฒ ? ๊ทธ ๋ฏธ์ง์ ์ํ์ ๋ค์ด๋ณด์์ผ๋ ์ฐ๋ฆฐ ์ํ์ผ๋ก ์ดํดํ์ง ๋ชปํ๊ณ ์์ต๋๋ค. ์ ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ํ์ผ๋ก ์ดํดํ์ง ๋ชปํ๋ฉด ๋ช ํํ ์์ง ๋ชปํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ๊ทธ๋์ Tensorfow๋ก ๋ณธ๊ฒฉ์ ์ผ๋ก ๋ค์ด๊ฐ๊ธฐ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์์๊ฐ๋ ๊ฐ์๋ฅผ ๋ง๋ค์์ต๋๋ค.
์ด ์๋ฆฌ์ฆ์ ์ต์ข ๋ชฉํ๋ ๋ณธ๋ ํ๋ ํฑํํก์ Tensorflow๋ก ์คํํ๋ ๊ฒ์ ๋๋ค.
https://www.inflearn.com/course/%ED%85%90%EC%84%9C%ED%94%8C%EB%A1%9C%EC%9A%B0-%EC%88%98%ED%95%99#
์ด ๋ฐฐ์ ์ฌ๋ฌ๋ถ๋ ํจ๊ป ์น์ ํด๋ณด์๋ฉด ์ข๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
โฉ55,000