์ธํ”„๋Ÿฐ ์˜๋ฌธ ๋ธŒ๋žœ๋“œ ๋กœ๊ณ 
์ธํ”„๋Ÿฐ ์˜๋ฌธ ๋ธŒ๋žœ๋“œ ๋กœ๊ณ 
BEST

๋ชจ๋‘๋ฅผ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning ํ•ด๋ณด๊ธฐ

LLM(Large Language Model)์˜ ๊ธฐ์ดˆ ๊ฐœ๋…๋ถ€ํ„ฐ ๊ณ ์„ฑ๋Šฅ LLM์ธ Llama 2 ๋ชจ๋ธ์„ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ์…‹์— Fine-Tuningํ•˜๋Š” ๋ฐฉ๋ฒ•๊นŒ์ง€ ์ฐจ๊ทผ์ฐจ๊ทผ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

Thumbnail

์ค‘๊ธ‰์ž๋ฅผ ์œ„ํ•ด ์ค€๋น„ํ•œ
[์ž์—ฐ์–ด ์ฒ˜๋ฆฌ] ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๊ฑธ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์–ด์š”

  • LLM(Large Language Model)์˜ ๊ธฐ์ดˆ ๊ฐœ๋…

  • ๊ณ ์„ฑ๋Šฅ LLM์ธ Llama 2 ๋ชจ๋ธ์„ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ์…‹์— Fine-Tuningํ•˜๋Š” ๋ฐฉ๋ฒ•

  • OpenAI API๋ฅผ ์ด์šฉํ•ด์„œ GPT๋ฅผ ๋‚˜๋งŒ์˜ ๋ฐ์ดํ„ฐ์…‹์— Fine-Tuningํ•˜๋Š” ๋ฐฉ๋ฒ•

  • ๋‹ค์–‘ํ•œ Parameter-Efficient Fine-Tuning (PEFT) ๊ธฐ๋ฒ•๋“ค

  • LLM์˜ ์„ฑ๋Šฅ์„ ์ตœ๋Œ€ํ•œ ์ด๋Œ์–ด๋‚ด๊ธฐ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง(Prompt Engineering) ๊ธฐ๋ฒ•๋“ค

์ตœ์‹  AI ๊ธฐ์ˆ  LLM, ๊ฐœ๋…๋ถ€ํ„ฐ ๋ชจ๋ธ ํŠœ๋‹๊นŒ์ง€!

โœจ ์ตœ์‹  AI ๊ธฐ์ˆ ์˜ ๊ฝƒ, LLM

Llama2์™€ OpenAI API๋ฅผ ์ œ๋Œ€๋กœ ํ™œ์šฉํ•˜๋ฉด, ํŠน์ • ๋ถ„์•ผ๋กœ ์ขํžŒ ์˜์—ญ์— ํ•œํ•ด ํ˜„์กดํ•˜๋Š” ์ตœ๊ฐ•์˜ LLM์ธ GPT-4๋ณด๋‹ค๋„ ๊ฐ•๋ ฅํ•œ LLM์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

  • โœ… ์ตœ์‹  LLM(Large Language Model) ๊ธฐ์ดˆ ๊ฐœ๋…๋ถ€ํ„ฐ Llama 2 Fine-Tuning๊นŒ์ง€ ๋‹จ๊ณ„๋ณ„๋กœ ์ตํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • โœ… ๋‚˜๋งŒ์˜ ๋ฐ์ดํ„ฐ์…‹์— Llama 2๋ฅผ Fine-Tuningํ•˜๋Š” ๋ฒ•์„ ์ฐจ๊ทผ์ฐจ๊ทผ ์ตํ˜€๋ณด์„ธ์š”!

์–ด๋–ค ๋ถ„๋“ค์„ ์œ„ํ•œ ๊ฐ•์˜์ธ๊ฐ€์š”?

์ตœ์‹  LLM ๋ชจ๋ธ์˜ 
๊ฐœ๋…๊ณผ ์›๋ฆฌ๋ฅผ 
ํƒ„ํƒ„ํ•˜๊ฒŒ ํ•™์Šตํ•˜๊ณ  
์‹ถ์€ ๋ถ„ 

๊ณ ์„ฑ๋Šฅ ์˜คํ”ˆ์†Œ์Šค 
LLM Llama 2
๋ฅผ 
๋‚˜๋งŒ์˜ ๋ฐ์ดํ„ฐ์…‹์— 
Fine-Tuning
ํ•˜๊ณ  
์‹ถ์€ ๋ถ„ 

PEFT์™€ ๊ฐ™์€ 
์ตœ์‹  LLM ํŠธ๋ Œ๋“œ๋ฅผ 
ํ•™์Šตํ•˜๊ณ  ์‹ถ์€ ๋ถ„ 

OpenAI API๋ฅผ ์ด์šฉํ•œ 
GPT Fine-Tuning 
๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•˜๊ณ  
์‹ถ์€ ๋ถ„


์„ ์ˆ˜ ๊ฐ•์˜ โœ…

๐Ÿ‘‹ ๋ณธ ๊ฐ•์˜๋Š” Python, ๋”ฅ๋Ÿฌ๋‹, ์ž์—ฐ์–ด์ฒ˜๋ฆฌ(NLP)์— ๋Œ€ํ•œ ์„ ์ˆ˜์ง€์‹์ด ํ•„์š”ํ•œ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค. ๋ฐ˜๋“œ์‹œ ์•„๋ž˜ ๊ฐ•์˜๋ฅผ ๋จผ์ € ์ˆ˜๊ฐ•ํ•˜์‹œ๊ฑฐ๋‚˜ ๊ทธ์— ์ค€ํ•˜๋Š” ์ง€์‹์„ ๊ฐ–์ถ˜ ๋’ค ๋ณธ ๊ฐ•์˜๋ฅผ ์ˆ˜๊ฐ•ํ•˜์„ธ์š”.

ํ›„์† ๊ฐ•์˜ โœ…

Q&A ๐Ÿ’ฌ

Q. LLM(Large Language Model)์ด ๋ฌด์—‡์ธ๊ฐ€์š”?

LLM์€ "Large Language Model"์˜ ์•ฝ์ž๋กœ, ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ํ›ˆ๋ จ๋œ ์ธ๊ณต์ง€๋Šฅ ์–ธ์–ด ๋ชจ๋ธ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP, Natural Language Processing) ์ž‘์—…์— ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋ฉฐ, ํ…์ŠคํŠธ ์ƒ์„ฑ, ๋ถ„๋ฅ˜, ๋ฒˆ์—ญ, ์งˆ๋ฌธ ์‘๋‹ต, ๊ฐ์ • ๋ถ„์„ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ผ๋ฐ˜์ ์œผ๋กœ LLM์€ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ ์ด์ƒ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜(parameter)๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ๋‹ค์–‘ํ•œ ์–ธ์–ด ํŒจํ„ด๊ณผ ๊ตฌ์กฐ๋ฅผ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ๋กœ, LLM์€ ์ƒ๋‹นํžˆ ์ •๊ตํ•˜๊ณ  ์ž์—ฐ์Šค๋Ÿฌ์šด ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด GPT (Generative Pre-trained Transformer) ์‹œ๋ฆฌ์ฆˆ์™€ ๊ฐ™์€ ๋ชจ๋ธ์€ OpenAI์— ์˜ํ•ด ๊ฐœ๋ฐœ๋˜์—ˆ๊ณ , ์ด๋Š” ๋Œ€ํ‘œ์ ์ธ LLM์˜ ํ•œ ์˜ˆ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ์›น ํŽ˜์ด์ง€, ์ฑ…, ๋…ผ๋ฌธ, ๊ธฐ์‚ฌ ๋“ฑ์˜ ํฐ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ›ˆ๋ จ๋˜๋ฉฐ, ๊ทธ ํ›„์—๋Š” ๋‹ค์–‘ํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž‘์—…์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

LLM์€ ํ˜„์žฌ ๋งŽ์€ ์ƒ์—…์  ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์—์„œ ์“ฐ์ด๊ณ  ์žˆ์œผ๋ฉฐ ์ฑ—๋ด‡, ๊ฒ€์ƒ‰ ์—”์ง„, ์ž๋™ ๋ฒˆ์—ญ ์„œ๋น„์Šค, ์ปจํ…์ธ  ์ถ”์ฒœ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ๊ทธ ๊ฐ€์น˜๋ฅผ ์ธ์ •๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ์—ฌ์ „ํžˆ ๊ณ ๋„์˜ ์ „๋ฌธ์„ฑ์„ ํ•„์š”๋กœ ํ•˜๋Š” ์ž‘์—…์—๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ž˜๋ชป๋œ ์ •๋ณด ์ƒ์„ฑ, ํŽธํ–ฅ์„ฑ, ์ดํ•ด ๋ถ€์กฑ ๋“ฑ์˜ ๋ฌธ์ œ๋„ ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Q. ์„ ์ˆ˜ ์ง€์‹์ด ํ•„์š”ํ•œ๊ฐ€์š”?

๋ณธ [๋ชจ๋‘๋ฅผ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning ํ•ด๋ณด๊ธฐ] ๊ฐ•์˜๋Š” ์ตœ์‹  LLM ๋ชจ๋ธ์˜ ์ƒ์„ธํ•œ ์„ค๋ช…๊ณผ ์‚ฌ์šฉ๋ฒ•์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋”ฅ๋Ÿฌ๋‹๊ณผ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ์— ๋Œ€ํ•œ ๊ธฐ์ดˆ์ง€์‹์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๋Š” ๊ฐ€์ •ํ•˜์— ๊ฐ•์˜๊ฐ€ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค. ๋”ฅ๋Ÿฌ๋‹๊ณผ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ์— ๋Œ€ํ•œ ๊ธฐ์ดˆ ์ง€์‹์ด ๋ถ€์กฑํ•˜๋‹ค๋ฉด ์„ ํ–‰ ๊ฐ•์˜์ธ [์˜ˆ์ œ๋กœ ๋ฐฐ์šฐ๋Š” ๋”ฅ๋Ÿฌ๋‹ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž…๋ฌธ NLP with TensorFlow - RNN๋ถ€ํ„ฐ BERT๊นŒ์ง€] ๊ฐ•์˜๋ฅผ ๋จผ์ € ์ˆ˜๊ฐ•ํ•˜์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค.

๐Ÿ“ข ์ˆ˜๊ฐ• ์ „ ํ™•์ธํ•ด์ฃผ์„ธ์š”

  • ๋…น์Œ ํ™˜๊ฒฝ์ƒ ์ผ๋ถ€ ์˜์ƒ์˜ ์Œ์งˆ์ด ๊ท ์ผํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. (์ˆ˜๊ฐ• ์ „ ๊ฐ•์˜ [๋ฏธ๋ฆฌ๋ณด๊ธฐ] ์ˆ˜์—…์„ ์ฐธ๊ณ ํ•ด์ฃผ์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค.)

์ด๋Ÿฐ ๋ถ„๋“ค๊ป˜
์ถ”์ฒœ๋“œ๋ ค์š”!

ํ•™์Šต ๋Œ€์ƒ์€
๋ˆ„๊ตฌ์ผ๊นŒ์š”?

  • ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ LLM(Large Language Model)์˜ ๊ฐœ๋…๊ณผ ํ™œ์šฉ๋ฒ•์„ ํ•™์Šตํ•˜๊ณ  ์‹ถ์€ ๋ถ„

  • ๋‚˜๋งŒ์˜ ๋ฐ์ดํ„ฐ์…‹์— ์ตœ์‹  LLM์„ Fine-Tuning ํ•ด๋ณด๊ณ  ์‹ถ์€ ๋ถ„

  • ๋”ฅ๋Ÿฌ๋‹ ์—ฐ๊ตฌ ๊ด€๋ จ ์ง์ข…์œผ๋กœ ์ทจ์—…์„ ์›ํ•˜์‹œ๋Š” ๋ถ„

  • ์ธ๊ณต์ง€๋Šฅ/๋”ฅ๋Ÿฌ๋‹ ๊ด€๋ จ ์—ฐ๊ตฌ๋ฅผ ์ง„ํ–‰ํ•˜๊ณ  ์‹ถ์€ ๋ถ„

  • ์ธ๊ณต์ง€๋Šฅ(AI) ๋Œ€ํ•™์›์„ ์ค€๋น„ ์ค‘์ด์‹  ๋ถ„

์„ ์ˆ˜ ์ง€์‹,
ํ•„์š”ํ• ๊นŒ์š”?

  • Python ์‚ฌ์šฉ ๊ฒฝํ—˜

  • ์„ ์ˆ˜๊ฐ•์˜ [์˜ˆ์ œ๋กœ ๋ฐฐ์šฐ๋Š” ๋”ฅ๋Ÿฌ๋‹ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž…๋ฌธ NLP with TensorFlow - RNN๋ถ€ํ„ฐ BERT๊นŒ์ง€] ์ˆ˜๊ฐ•๊ฒฝํ—˜

์•ˆ๋…•ํ•˜์„ธ์š”
AISchool์ž…๋‹ˆ๋‹ค.

8,166

๋ช…

์ˆ˜๊ฐ•์ƒ

555

๊ฐœ

์ˆ˜๊ฐ•ํ‰

342

๊ฐœ

๋‹ต๋ณ€

4.6

์ 

๊ฐ•์˜ ํ‰์ 

28

๊ฐœ

๊ฐ•์˜

๋”๋ณด๊ธฐ

์ปค๋ฆฌํ˜๋Ÿผ

์ „์ฒด

111๊ฐœ โˆ™ (25์‹œ๊ฐ„ 43๋ถ„)

ํ•ด๋‹น ๊ฐ•์˜์—์„œ ์ œ๊ณต:

์ˆ˜์—…์ž๋ฃŒ
๊ฐ•์˜ ๊ฒŒ์‹œ์ผ: 
๋งˆ์ง€๋ง‰ ์—…๋ฐ์ดํŠธ์ผ: 

์ˆ˜๊ฐ•ํ‰

์•„์ง ์ถฉ๋ถ„ํ•œ ํ‰๊ฐ€๋ฅผ ๋ฐ›์ง€ ๋ชปํ•œ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.
๋ชจ๋‘์—๊ฒŒ ๋„์›€์ด ๋˜๋Š” ์ˆ˜๊ฐ•ํ‰์˜ ์ฃผ์ธ๊ณต์ด ๋˜์–ด์ฃผ์„ธ์š”!