해결된 질문
24.04.03 15:29 작성
·
275
1
안녕하세요. 학습에 관련하여 질문이 있어 남깁니다.
현재 코랩에서 이미지 데이터에 대한 학습을 진행 중에 있습니다.
import os.path as osp
mmcv.mkdir_or_exist(osp.abspath(cfg.work_dir))
train_detector(model, datasets, cfg, distributed=False, validate=True)
위와 같은 코드를 진행하였을 때, epoch 1번 수행 후 세션이 종료 됩니다.
위와 같은 문제로 validate=false로 진행 할 경우, 학습은 잘 작동하지만 validation에 대한 loss값만 표시되고 AP 값은 나오지 않아 학습된 모델의 평가를 어떻게 진행해야 할지 의문입니다.
답변 2
0
2024. 04. 03. 22:58
안녕하십니까,
아, 이게 mmdetection이 버전업이 되면서 validation=True면 세션이 다운이 됩니다. 제 생각엔 이걸 맞추려면 torch와 mmdetection이 모두 버전업이 같이 되어야 할 것 같은데, 이러면 기존 강의 실습 코드들이 너무 많이 바뀌게 될 것 같습니다. 아쉽지만 지금 강의 코드에서는 validation이 False로 동작되어야 합니다.
감사합니다.
2024. 04. 04. 18:11
아쉽지만, 현재 실습 코드 버전에서는 validation이 아닌 train 데이터 기반 loss로 성능을 가늠해야 할 것 같습니다.
0
안녕하세요, 인프런 AI 인턴입니다.
조인영님의 문제에 대해 제공된 과거 정보에서 유사한 상황을 확인해보았습니다.
코랩 세션 다운 문제와 관련해서는, “코랩 세션이 다운되었습니다” 질문에서 유사한 상황을 다루었습니다. 이 질문에서 다음과 같은 해결책을 제안했습니다:
validate=True
설정 시, mmdetection이 버전 업되면서 segmentation의 evaluation을 진행하다 중간에 세션이 다운되는 현상이 발생할 수 있다고 언급되었습니다. 이에 대 한 권장 사항으로는 validate=False
를 사용하는 것입니다.학습된 모델의 평가에 대한 질문으로, “validate=False로 진행할 경우 학습은 잘 되지만 validation에 대한 loss값만 표시되고 AP 값은 나오지 않는 문제”에 대해서는 해당 질문에서 직접적인 해결 방법을 제시하지는 않았습니다. 다만, 대체적인 문제 상황이 당신의 질문과 관련있어 보입니다.
또한, “선생님께 질문이 있습니다” 질문에서는 TensorFlow Object Detection API을 사용하는 상황에서의 학습 및 테스트 데이터 세트 나누기에 대해 논의되었습니다. 여기서도 유사하게 Validation 세트를 어떻게 사용해야 하는지, 그리고 mAP 결과를 보는 방법에 대해 언급되었습니다.
현재 제공한 정보를 기반으로 정확한 답변을 찾기 어렵거나, 질문이 조금 더 구체적인 기술적 해결이 필요한 경우라고 판단됩니다. 따라서 직접적인 답변 대신 추천 드리는 링크를 참고해 보시는 것을 권장드립니다.
저는 조인영님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
2024. 04. 04. 10:28
친절한 답변 감사합니다.
그렇다면 모델의 성능 평가를 진행하기 위해서는 loss로 성능을 평가할 수 있는 코드로 진행해야 하는 것일까요?