해결된 질문
작성
·
181
0
Mask_RCNN에서 Balloon 데이터를 학습할 때 다음과 같은 오류가 뜨는 이유가 무엇일까요?ㅠㅠ
저는 GPU가 노트북에 내장되어 있어 구글클라우드를 이용하지 않고 노트북으로 코드를 돌렸는데
BATCH_SIZE도 1로 설정하였고, 아무리 구글에 찾아봐도 이 오류의 이유를 모르겠습니다ㅠㅠ
또한 snapshots 폴더를 확인해보면 학습이 조금 시작되는 듯 하다가 바로 중단되는 듯 합니다.
CUDA, cudnn, tensorflow-gpu, keras 버전도 맞추었고, GPU_COUNT 값도 변경해보았습니다.
하지만 작업관리자에서 성능을 보면 GPU가 크게 사용되지 않는 것도 확인할 수 있었습니다.
노트북에서는 GPU를 이용하여 학습시키는 것이 무리인걸까요?ㅠㅠ 이 오류 때문에 3일 밤을 새는 것 같습니다ㅠㅠ
그럼 답변 부탁드리겠습니다! 감사합니다!
답변 2
0
0
안녕하십니까,
아이고, 3일밤이나, 고생하셨다니 보는 제가 다 안타깝습니다.
오류 내용만 봐서는 GPU Memory 부족같습니다. Resource ExhaustedError 에서 OOM(out of memory) 같습니다.
일단 GPU Memory는 16G 이상 권장입니다(제가 실습 코드 Test 를 GPU 16G에서 했습니다.)
노트북의 GPU Memory 사이즈 확인 부탁드립니다.
Config에서 IMAGES_PER_GPU = 1 로 되어 있는지도 확인 부탁드립니다.
확인 후 글 업데이트 부탁드립니다.