작성
·
547
0
안녕하세요. 선생님
정말 질 좋은 강의를 들을 수 있어서 행운이라고 생각합니다.
CatnDog_Sequence기반으로 개인적으로 Modify하여 공부를 해보고 있습니다.
제가 갖고 있는 이미지는 흑백 이미지 인데요.
image = cv2.imread("D:\\Lens_image_data\\test\\test_set\\sort1\\1.BMP", cv2.IMREAD_ANYCOLOR)
print(image.shape)
shape을 print해보았을 때, (1548, 1544)으로 RGB 3채널이 아닌 것도 확인하였습니다.
1) 따라서 Image_Batch 배열 진행 시에도 뒤에 3채널은 빼고 넣었으며,
image_batch = np.zeros((image_name_batch.shape[0], IMAGE_SIZE, IMAGE_SIZE), dtype='float32')
2) 이미지를 cv2로 읽어올 때도 아래와 같이 변경해보았습니다.
image = cv2.imread(image_name_batch[image_index], cv2.IMREAD_UNCHANGED)
이렇게 되면 shape이 (64, 224, 224) (64,) 이렇게 나오는데, 흑백 이미지로 할 때는 상기와 같이 바꾸는게 맞는 것인지 궁금합니다.
답변 2
0
안녕하십니까,
잘 듣고 계시다니, 저도 기분이 좋군요.
CNN을 사용하려면 이미지 채널이 무조건 3차원이 되어야 합니다(Batch 포함 4차원)
적용하신대로 마지막 1채널의 이미지를 3개 채널로 복사해서 만드셔도 되고,
그냥 채널을 마지막 차원에 추가하셔도 됩니다.
rgb_image = np.expand_dims(gray_image, -1)
감사합니다.
0
if self.pre_func is not None:
image = self.pre_func(image)
image_batch[image_index] = image
image_batch = np.repeat(image_batch[..., np.newaxis], 3, -1)
return image_batch, label_batch
ImageNet을 사용하려면 채널이 무조건 3개가 입력이 되어야 하는 것 같네요.. 일단은 gray image를 RGB 처럼 3채널로 만들어 보았습니다. 단순 1채널 이미지를 3채널 형식에 복사하는 형식으로 짜보았는데, 잘 될련지 모르겠네요
답변해주셔서 감사합니다. 결국 imagenet을 이용하려면 총 4차원이 되어야 하는게 맞군요. Gray Image를 Color image처럼 차원을 맞춰서 진행해보도록 하겠습니다.