Q. LLM(Large Language Model)์ด ๋ฌด์์ธ๊ฐ์?
LLM์ "Large Language Model"์ ์ฝ์๋ก, ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ธํธ์์ ํ๋ จ๋ ์ธ๊ณต์ง๋ฅ ์ธ์ด ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค. ์ด๋ฌํ ๋ชจ๋ธ์ ์์ฐ์ด ์ฒ๋ฆฌ(NLP, Natural Language Processing) ์์
์ ๋๋ฆฌ ์ฌ์ฉ๋๋ฉฐ, ํ
์คํธ ์์ฑ, ๋ถ๋ฅ, ๋ฒ์ญ, ์ง๋ฌธ ์๋ต, ๊ฐ์ ๋ถ์ ๋ฑ ๋ค์ํ ์์
์ ์ํํ ์ ์์ต๋๋ค.
์ผ๋ฐ์ ์ผ๋ก LLM์ ์๋ฐฑ๋ง ๊ฐ ์ด์์ ๋งค๊ฐ๋ณ์(parameter)๋ฅผ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, ์ด๋ ๋ชจ๋ธ์ด ๋ค์ํ ์ธ์ด ํจํด๊ณผ ๊ตฌ์กฐ๋ฅผ ํ์ตํ ์ ์๊ฒ ํด์ค๋๋ค. ๊ทธ ๊ฒฐ๊ณผ๋ก, LLM์ ์๋นํ ์ ๊ตํ๊ณ ์์ฐ์ค๋ฌ์ด ํ
์คํธ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด GPT (Generative Pre-trained Transformer) ์๋ฆฌ์ฆ์ ๊ฐ์ ๋ชจ๋ธ์ OpenAI์ ์ํด ๊ฐ๋ฐ๋์๊ณ , ์ด๋ ๋ํ์ ์ธ LLM์ ํ ์์
๋๋ค. ์ด๋ฌํ ๋ชจ๋ธ์ ์น ํ์ด์ง, ์ฑ
, ๋
ผ๋ฌธ, ๊ธฐ์ฌ ๋ฑ์ ํฐ ํ
์คํธ ๋ฐ์ดํฐ์
์์ ํ๋ จ๋๋ฉฐ, ๊ทธ ํ์๋ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ์์
์ ์ ์ฉ๋ ์ ์์ต๋๋ค.
LLM์ ํ์ฌ ๋ง์ ์์
์ ์์ฉ ํ๋ก๊ทธ๋จ์์ ์ฐ์ด๊ณ ์์ผ๋ฉฐ ์ฑ๋ด, ๊ฒ์ ์์ง, ์๋ ๋ฒ์ญ ์๋น์ค, ์ปจํ
์ธ ์ถ์ฒ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๊ทธ ๊ฐ์น๋ฅผ ์ธ์ ๋ฐ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ด๋ฌํ ๋ชจ๋ธ์ ์ฌ์ ํ ๊ณ ๋์ ์ ๋ฌธ์ฑ์ ํ์๋ก ํ๋ ์์
์๋ ํ๊ณ๊ฐ ์์ ์ ์์ผ๋ฉฐ, ์๋ชป๋ ์ ๋ณด ์์ฑ, ํธํฅ์ฑ, ์ดํด ๋ถ์กฑ ๋ฑ์ ๋ฌธ์ ๋ ์์ ์ ์์ต๋๋ค.
Q. ์ ์ ์ง์์ด ํ์ํ๊ฐ์?
๋ณธ [๋ชจ๋๋ฅผ ์ํ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning ํด๋ณด๊ธฐ] ๊ฐ์๋ ์ต์ LLM ๋ชจ๋ธ์ ์์ธํ ์ค๋ช
๊ณผ ์ฌ์ฉ๋ฒ์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ๋ฅ๋ฌ๋๊ณผ ์์ฐ์ด์ฒ๋ฆฌ์ ๋ํ ๊ธฐ์ด์ง์์ ๊ฐ์ง๊ณ ์๋ค๋ ๊ฐ์ ํ์ ๊ฐ์๊ฐ ์งํ๋ฉ๋๋ค. ๋ฅ๋ฌ๋๊ณผ ์์ฐ์ด์ฒ๋ฆฌ์ ๋ํ ๊ธฐ์ด ์ง์์ด ๋ถ์กฑํ๋ค๋ฉด ์ ํ ๊ฐ์์ธ [์์ ๋ก ๋ฐฐ์ฐ๋ ๋ฅ๋ฌ๋ ์์ฐ์ด ์ฒ๋ฆฌ ์
๋ฌธ NLP with TensorFlow - RNN๋ถํฐ BERT๊น์ง] ๊ฐ์๋ฅผ ๋จผ์ ์๊ฐํ์๊ธธ ๋ฐ๋๋๋ค.