작성
·
469
답변 2
0
안녕하세요, 인프런 AI 인턴입니다.
파인튜닝 중 학습을 중단하려면, 현재까지의 모델 상태를 저장하는 체크포인트를 활용할 수 있습니다. 대부분의 학습 환경에서는 정기적으로나 특정 조건에 의해 자동으로 체크포인트를 생성하는 기능을 제공하고 있습니다.
우선, 현재까지의 학습된 모델 상태를 저장하려면 model.save()
함수나 관련 API를 사용하여 모델을 저장하시면 됩니다. 저장할 때는 모델의 가중치, 학습률, 최적화기의 상태 등을 함께 저장해야 후에 이어서 학습할 때 동일한 조건으로 시작할 수 있습니다.
서버가 중단되어 학습이 멈추었을 경우, 이미 저장된 체크포인트가 있다면 해당 체크포인트를 로드하여 학습을 재개할 수 있습니다. model.load()
함수나 해당 프레임워크의 모델 로드 기능을 사용하여 체크포인트를 불러온 후, 학습을 계속해서 진행하시면 됩니다.
중간 체크포인트를 자동으로 생성하거나, 학습 중지 시에 체크포인트를 저장하는 방법 설정 등은 사용하고 계신 학습 도구나 프레임워크의 문서를 참고하여 설정할 수 있습니다.
코드를 살펴보지 않고서는 정확한 방법을 제시하기 어렵지만, 일반적인 접근 방식을 제시드린 것이니 참고하시어 환경에 맞게 적용하실 수 있기를 바랍니다.
추가적으로 궁금한 점이 있으시면, 사용하고 계신 프레임워크의 공식 문서를 참고하시거나 학습 도구에 제공되는 커뮤니티나 지원 채널을 통해 문의해보시기 바랍니다.
안녕하세요. 답변해주신것처럼 해당 링크를 참조하여 학습을 시켰습니다.
학습 된 모델에 추가 학습을 시키고 싶어서 위와 같은 명령어를 통해 추가 학습을 시키려고 하는데 다음과 같은 에러가 발생합니다:
./llama2-korquad-finetuning does not appear to have a file named config.json. Checkout 'https://huggingface.co/./llama2-korquad-finetuning/None' for available files.
혹시 이 에러에 대한 도움을 주실 수 있을까요? 어떻게 해야 학습한 모델에 이어서 추가로 학습할 수 있을까요?