인프런 커뮤니티 질문&답변

munhaneul2208님의 프로필 이미지
munhaneul2208

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

coco128 데이터로 Train 실습 - wandb(weight and bias) 적용하기

train 오류

작성

·

554

0

안녕하세요 교수님.

실습 코드(python3 train.py --img 640 --batch 16 --epochs 3 --data coco128.yaml --weights yolov3.pt --nosave) 수행 중 아래와 같은 오류가 발생햬습니다. 어떻게 하면 오류를 해결 할 수 있을지 궁금합니다.

현재 코랩 환경이 아닌 우둔투 local 환경에서 수행하고 있습니다.

 

RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
Exception ignored in: <bound method _MultiProcessingDataLoaderIter.__del__ of <torch.utils.data.dataloader._MultiProcessingDataLoaderIter object at 0x7f22b6b32588>>
Traceback (most recent call last):
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1328, in __del__
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1262, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status'
Exception ignored in: <bound method _MultiProcessingDataLoaderIter.__del__ of <torch.utils.data.dataloader._MultiProcessingDataLoaderIter object at 0x7f235350fc18>>
Traceback (most recent call last):
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1328, in __del__
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1262, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status

 

답변 2

0

저도 우분투에 그래픽카드 2개 연동헤서 사용하고있는데 같은오류가 나서 찾아보니 --workers 0 옵션을 주면 오류가 사라졌습니다.

workers가 cpu코어 개수 같은데 gpu연결되어서 오류가 나는건지 자세한건 모르겠습니다.

권 철민님의 프로필 이미지
권 철민
지식공유자

오 해결이 되었다니 다행입니다 

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

개별 환경에서 오류 메시지를 제가 잡기는 매우 어렵습니다. 

오류 메시지로만 봐서는 cuDNN의 버전이 제대로 설치가 안된걸로 보입니다만, 

mmdetection 실습코드는 잘되고 yolo는 안되는 건가요? 

munhaneul2208님의 프로필 이미지
munhaneul2208

작성한 질문수

질문하기