질문 게시판

고민있어요

스터디

팀 프로젝트

멘토링

멘토링 후기

수강평

With us

인프런 피드

블로그

인프런 소개

공지사항

대시보드

강의

홈

로드맵

더보기

인공지능딥러닝 · 머신러닝

생성형 AI 기초와 동작 원리 이해대시보드

27명이 수강하고 있어요.

생성형AI transformer multimodal Python openai

77,000원

월 15,400원

5개월 할부 시

지식공유자: YoungJea Oh

총 46개 수업 (8시간 10분)

수강기한:

수료증: 발급

난이도: --

지식공유자 답변이 제공되는 강의입니다

폴더에 추가17

다른 수강생들이 자주 물어보는 질문이 궁금하신가요?

미해결
생성형 AI 기초와 동작 원리 이해
ChatGPT RLHF 관련 질문드립니다!
안녕하세요. NLP 강의 들었었는데 쉽고 정확하게 강의해주셔서 이번에 새로나온 강의도 신청하게 되었습니다! ㅎㅎ질문 드립니다.1) RLHF에서 1단계는 GPT-3가 특정 질문에 대해 아무말 대잔치하며 생성했을 때, 인간이 선호하는 방식은 바로 이거야 라고 알려주어 아무말 대잔치를 못하도록 모델이 학습되는 과정(=SFT) 이라고 이해가 되는데 맞나요? 2) 2단계는 1단계에서 생성한 여러 답변들에 인간이 랭킹을 매긴다는 것을 이해했습니다. 인간이 매긴 랭킹들에 대한 데이터 셋을 RM(Reward Model)이 학습한다는건,예를들어 RM의 input은 1단계에서 GPT가 생성한 문장셋, output은 각 문장셋들에 대한 인간이 매긴 각 랭킹을 맞추도록 학습하는 과정이 맞나요? 3) 3단계는 "1단계에서 Fine-Tuned된 모델을 이제는 인간이 보상해주는 대신 2단계에서 생성한 RM이 인간역할을 하며 지도해준다" 라고 이해해도 될까요? 좋은 강의 다시 한번 감사합니다 :)
David · 2일 전 · 생성형 AI 기초와 동작 원리 이해
투표점수
0
조회수
28
답변
1