작성
·
224
0
교수님 안녕하세요
실무에서 분류하는 과제를 하고 있습니다.
(파이썬 코드를 직접 짜고 있지는 않고 상용 딥러닝 툴을 써서 하고 있습니다.)
공장안에서 여러 설비들이 조금씩 다른 세팅으로 카메라가 세팅이 되어있는 상태이고
(이미 너무 많은 설비들이 있는데 이거를 지금 시점에 같은 조건으로 다 맞추기는 힘들 것 같습니다.)
관리를 하려면 이 조금씩 세팅이 다른 카메라 이미지를 하나의 모델로 만들어야 한다고 판단하고 있습니다.
밝기 세팅이나 카메라 노출 회전 여부가 조금씩 다른데
1) 전체 학습 이미지 데이터 셋
2) 전부다 회전을 시켜버리고
3) 전부다 밝기 조절을 해서
ex) 제품의 특정 위치의 이미지상 밝기가 대부분 10이고 어떤 카메라는 특이하게
15라면 가지고 있는 학습 이미지를 다 15로 바꿔버린다음에 추가 학습을 시킴
20인 카메라가 확인되면 다 20으로 바꿔버린다음에 추가 학습을 시킴
학습 데이터 셋을 2배 3배 4배 늘려버려서 학습을 시킨다면
모델의 성능이 좋아지게 될지 성능이 떨어지게 될지 어떻게 하는게 유리할지
조언을 주실 수 있을까요?
잘모르는 부분이어서 조금 답답한 부분이 있어서 혹시나 도움을 받을 수 있을까 해서
문의드리게 되었습니다.
답변 2
1
안녕하십니까,
저도 질문에 대해서 생각을 해볼 거리가 있어서 답변이 늦었습니다.
제 생각엔 모델 학습도 중요하지만, 모델을 가지고 추론/예측(inference/predict) 할 때 어떤 이미지를 가지고 할 것인지도 중요하다고 봅니다.
그러니까, 어떤 카메라에 있는 이미지를 기반으로 추론을 할 건지를 생각해 봐야 할 것 같습니다.
예를 들어 밝기가 20인 이미지로 학습된 모델은 밝기가 20인 이미지를 밝기가 10인 이미지보다 더 잘 예측 할 수 있을 것입니다. 학습 이미지는 가급적이면 예측 이미지와 환경이 비슷하면 좋습니다.
하지만 특정한 환경으로 주어진 이미지가 아니라 동일한 이미지이지만 밝기가 10이 될지, 20이 될지, 30일 될지 확실하지 않고 random 하게 선택되는 이미지를 예측한다면, 제 생각엔 특별히 별도의 보정 없이 일단 다 이미지들을 합쳐서 학습을 하되, augmentation을 이미지에 적용하여 학습하는 일반적인 방법을 적용해도 크게 성능상의 문제 없이 좋은 모델이 만들어 질 것 같습니다.
말씀하신 추가학습에 대한 의미를 제가 정확히 이해하지는 못했지만, 이미 학습이 된 모델을 기존 weight를 유지한채로 다시 새로운 이미지로 학습한다는 의미로 말씀하신거라면, 굳이 그렇게 까지 하실 필요는 없다고 봅니다.
적어주신 내용으로는 위에 말씀 드린 사항 정도가 답변이 될 것 같습니다. 원하시는 답변이 아니면 좀 더 상세한 환경이나 생각하신 바를 기술해 주시면 제가 좀 더 추가적인 언급을 드리도록 하겠습니다.
감사합니다.
0