컴퓨터 비전 활용 분야 - 이미지 분류
컴퓨터 비전 분야는 기존의 통계적 방법에서 딥러닝 신경망 방법으로 전환되고 있습니다. 비록 여전히 해결해야 할 많은 도전 과제가 존재하지만, 딥러닝 방법은 특정 문제에서 최첨단 결과를 달성하고 있습니다. 원문: 9 Applications of Deep Learning for Computer Vision – MachineLearningMastery.com컴퓨터 비전 분야는 기존의 통계적 방법에서 딥러닝 신경망 방법으로 전환되고 있습니다. 비록 여전히 해결해야 할 많은 도전 과제가 존재하지만, 딥러닝 방법은 특정 문제에서 최첨단 결과를 달성하고 있습니다. 딥러닝 모델의 벤치마크 문제에서의 성능뿐만 아니라, 단일 모델이 이미지를 통해 의미를 학습하고 비전 작업을 수행할 수 있다는 사실이 더욱 흥미롭습니다. 이는 전문적이고 수작업으로 설계된 방법들의 파이프라인을 필요로 하지 않게 만듭니다.여기서는 딥러닝 방법이 일부 진전을 이루고 있는 아홉 가지 흥미로운 컴퓨터 비전 작업을 소개합니다.그럼 시작해 봅시다.컴퓨터 비전 활용 분야딥러닝이 사용된 여러 컴퓨터 비전 문제를 살펴보겠습니다:1. 이미지 분류 (Image Classification)2. 위치 지정과 함께 하는 이미지 분류 (Image Classification with Localization)3. 객체 검출 (Object Detection)4. 객체 분할 (Object Segmentation)5. 이미지 스타일 전환 (Image Style Transfer)6. 이미지 색상화 (Image Colorization)7. 이미지 복원 (Image Reconstruction)8. 이미지 초해상도 (Image Super-Resolution)9. 이미지 합성 (Image Synthesis)10. 기타 문제들이미지 분류(인식) 작업의 경우 ILSVRC의 명명 규칙이 채택되었습니다. 이 작업들은 이미지에 중점을 두고 있지만, 비디오의 프레임에도 일반화할 수 있습니다.딥러닝이 잘 수행되는 더 학문적인 하위 문제들보다는 사용자가 관심을 가질 만한 실질적인 문제 유형에 초점을 맞추려고 했습니다. 각 예제는 문제 설명, 예제, 그리고 방법과 결과를 입증하는 논문 참고 자료를 제공합니다.오늘은 이미지 분류에 대해 알아봅시다.컴퓨터 비전 활용 분야 1 – 이미지 분류 (Image Classification)이미지 분류는 전체 이미지나 사진에 레이블을 할당하는 작업을 의미합니다. 이 문제는 “객체 분류 (object classification)” 또는 “이미지 인식 (image recognition)”이라고도 불리며, 후자의 경우 이미지를 분류하는 것과 관련된 더 넓은 범위의 작업에 적용될 수 있습니다.이미지 분류 예시엑스레이를 암으로 진단하거나 그렇지 않다고 분류 (이진 분류).손으로 쓴 숫자를 분류 (다중 클래스 분류).얼굴 사진에 이름을 할당 (다중 클래스 분류).인기 있는 데이터셋MNIST 데이터셋: 벤치마크 문제로 사용되는 손글씨 숫자 이미지 분류.SVHN 데이터셋: 실생활에서 손글씨 숫자 사진을 분류하는 데이터셋.CIFAR-10: 10개의 클래스에 대해 사진을 분류하는 데이터셋.CIFAR-100: 100개의 클래스에 대해 사진을 분류하는 데이터셋.이미지 분류 작업 관련 논문과 결과를 모아놓은 웹페이지:Classification datasets resultsILSVRC 대회ILSVRC (Large Scale Visual Recognition Challenge)는 매년 열리는 대회로, 팀들이 ImageNet 데이터베이스에서 추출된 데이터를 사용하여 다양한 컴퓨터 비전 작업에서 최고의 성능을 목표로 경쟁합니다. 이 대회에서 발표된 논문들은 이미지 분류의 중요한 발전에 기여했습니다. 대표적인 논문으로는 다음과 같습니다:ImageNet Classification With Deep Convolutional Neural Networks (2012)Very Deep Convolutional Networks for Large-Scale Image Recognition (2014)Going Deeper with Convolutions (2015)Deep Residual Learning for Image Recognition (2015) 컴퓨터 비전 활용 분야 2 – 이미지 분류와 위치 지정 (Image Classification with Localization)이미지 분류와 위치 지정 작업은 이미지에 클래스 레이블을 할당하고, 이미지 내 객체의 위치를 경계 상자(bounding box)로 표시하는 것입니다. 이는 단순한 이미지 분류보다 더 어려운 문제입니다.이미지 분류와 위치 지정 예시엑스레이를 암으로 분류하고 암이 있는 부위에 상자를 그리는 것.동물 사진을 분류하고 각 장면에서 동물 주위에 상자를 그리는 것.주요 데이터셋PASCAL VOC (Visual Object Classes): 이 데이터셋은 수년간 컴퓨터 비전 챌린지에서 사용되었습니다. 예를 들어 VOC 2012는 이미지 분류와 위치 지정 작업을 위한 고전적인 데이터셋입니다.ILSVRC2016: 이 데이터셋은 15만 장의 사진으로 구성되어 있으며, 1,000개의 객체 카테고리를 포함하고 있습니다.이 작업은 이미지 내 동일 객체의 여러 예제 주위에 경계 상자를 추가하는 것을 포함할 수 있습니다. 따라서 이 작업은 “객체 검출”이라고도 불릴 수 있습니다.관련 논문이미지 분류와 위치 지정 작업에 대한 중요한 논문들은 다음과 같습니다:Selective Search for Object Recognition (2013)Rich feature hierarchies for accurate object detection and semantic segmentation (2014)Fast R-CNN (2015)