인프런 커뮤니티 질문&답변

Elephant Biggy님의 프로필 이미지
Elephant Biggy

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Balloon 데이터세트를 학습할 때 오류가 뜨는 이유가 무엇일까요?ㅠㅠ

해결된 질문

작성

·

181

0

Mask_RCNN에서 Balloon 데이터를 학습할 때 다음과 같은 오류가 뜨는 이유가 무엇일까요?ㅠㅠ

저는 GPU가 노트북에 내장되어 있어 구글클라우드를 이용하지 않고 노트북으로 코드를 돌렸는데

BATCH_SIZE도 1로 설정하였고, 아무리 구글에 찾아봐도 이 오류의 이유를 모르겠습니다ㅠㅠ

또한 snapshots 폴더를 확인해보면 학습이 조금 시작되는 듯 하다가 바로 중단되는 듯 합니다.

CUDA, cudnn, tensorflow-gpu, keras 버전도 맞추었고, GPU_COUNT 값도 변경해보았습니다.

하지만 작업관리자에서 성능을 보면 GPU가 크게 사용되지 않는 것도 확인할 수 있었습니다.

노트북에서는 GPU를 이용하여 학습시키는 것이 무리인걸까요?ㅠㅠ 이 오류 때문에 3일 밤을 새는 것 같습니다ㅠㅠ

그럼 답변 부탁드리겠습니다! 감사합니다!

답변 2

0

정말 감사합니다 박사님!!!

오류를 해결했어요!! 정말 감사합니다!!!

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

아이고, 3일밤이나, 고생하셨다니 보는 제가 다 안타깝습니다.

오류 내용만 봐서는 GPU Memory 부족같습니다.  Resource ExhaustedError 에서 OOM(out of memory) 같습니다.

일단 GPU Memory는 16G 이상 권장입니다(제가 실습 코드 Test 를 GPU 16G에서 했습니다.)

노트북의 GPU Memory 사이즈 확인 부탁드립니다.

Config에서 IMAGES_PER_GPU = 1 로 되어 있는지도 확인 부탁드립니다.

확인 후 글 업데이트 부탁드립니다.

Elephant Biggy님의 프로필 이미지
Elephant Biggy

작성한 질문수

질문하기