작성
·
67
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
질문해주신 내용에 대해 답변드리자면, 여기서 말하는 ‘모델’은 주로 네트워크의 구조를 의미합니다. 즉, 여러 층(layer)으로 구성된 신경망(Neural Network)을 가리킵니다. 모델이 복잡하다는 것은 대체로 더 많은 레이어나 파라미터를 가지고 있는 경우를 의미하며, 이는 손실 함수(Loss Function) 자체보다는 모델의 구조와 깊이에 초점을 맞춘 표현입니다.
손실 함수는 모델이 얼마나 잘 또는 못하고 있는지를 측정하는 기준으로 사용되며, 모델을 훈련시키는 동안 이 손실 함수의 값을 최소화하는 파라미터를 찾는 과정에서 local minima와 global minima의 구분이 중요한 개념으로 논의됩니다. 복잡한 모델의 경우, 네트워크가 더 다양한 데이터 패턴을 학습할 수 있기 때문에 local minima와 global minima의 성능 차이가 비교적 작다고 할 수 있습니다.