작성
·
522
·
수정됨
0
LLama2 모델을 이용하여 특정 분야의 리포트를 작성해주는 모델로 파인튜닝 하고 싶습니다.(Chat GPT 의 complete 모델 처럼)
너무 막연한 질문이긴 하지만..
이때 필요한 데이터 셋의 형태는 어떤 형태이며, 어떤 모델을 어떤식으로 파인튜닝을 진행해야하는지 가이드를 주실 수 있을까요?
예를들어 제가 원하는 모델은 input 으로 "안녕하세요. 이번 보고서" 라는 텍스트를 넣으면 output 으로 "에서는 다음과 같은 내용을 다룰예정입니다." 의 텍스트가 나오는 것 입니다.
input 텍스트를 넣으면 input 텍스트 이후에 올 수 있는 특정 분야에 관련된 텍스트를 자동으로 완성해주는 모델을 만들기 위해서 어떤식으로 접근해야 할까요?
답변 2
0
안녕하세요~. 반갑습니다.
말씀해주신대로 보고서의 뒷부분을 완성하는 모델을 만들고 싶으실 경우 input 문장에 어떤 주제의 보고서로 분기할 것인지에 대한 최소한의 정보를 포함한 형태로 input을 구성한뒤 뒤에 output 부분에 해당 주제의 내용이 들어가 있는 보고서 형태로 데이터셋을 구성한뒤 학습시키셔야 할 것 같습니다.
기존 예제를 토대로 예시를 들면 아래와 같은 형태가 될 것입니다.
'Below is an instruction that describes a task. Write a response that appropriately completes the request. ### Instruction: {question} ### Response: {answer}'
[데이터1]
question : "안녕하세요. 이번 보고서는 한국의 저출산에 관련된 보고서입니다. 한국의 저출산은 여러 원인이 있으며"
answer : "{한국의 저출산에 관련된 보고서 뒤에 내용}"
[데이터2]
question : "안녕하세요. 이번 보고서는 지구온난화에 관련된 보고서입니다. 지구온난화는 여러 원인이 있으며"
answer : "{지구온난화에 관련된 보고서 뒤에 내용}"
좋은 하루되세요.
감사합니다.
0
안녕하세요, 인프런 AI 인턴입니다.
sdt님의 질문에 답변드리겠습니다.
자동완성 모델을 파인튜닝하는 경우, 일반적으로 다음과 같은 절차를 따를 수 있습니다.
데이터셋 구축:
모델 선정:
파인튜닝 절차:
모델 평가:
이 과정을 거쳐서 sdt님의 요구사항에 맞는 자동완성 모델을 개발하실 수 있습니다.
코딩 및 모델 파인튜닝에 대한 보다 구체적인 가이드를 원하시면 인프런에 있는 인공지능 카테고리의 강의를 참고하시면 도움이 될 것 같습니다.
강의 결정에 어려움이 있으시면, 인프런 지니의 입문강의 추천이나 로드맵, 베스트셀러 강의, 스킬태그 검색 기능 등을 이용해보시기 바랍니다.
도움이 필요하시면 언제든지 ‘문의하기’를 통해 질문하시면 빠르게 답변 드리겠습니다.