인프런 커뮤니티 질문&답변

엽강통강님의 프로필 이미지
엽강통강

작성한 질문수

딥러닝 CNN 완벽 가이드 - Fundamental 편

다채널 입력 데이터의 Convolution 적용 이해 - 01

데이터 라벨값 넣어줄때 질문이 있습니다

작성

·

292

0

안녕하세요 선생님

https://www.kaggle.com/datasets/mehradaria/covid19-lung-ct-scans

선생님의 자료를 보면서 프로젝트를 하고 있는 학생입니다

위의 자료를 통해서 정상폐 또는 코로폐를 구분하려고 하는데

해당 데이터에는 라벨값 (0,1)없어서 만들어 줄려고 합니다

따라서 제가 사용한 코드는

 


target = []

#폴더경로

data_path = os.listdir("C:/Users/shingeon94/Desktop/5_test/data")

for i in range (len(data_path)):

if "Non-COVID" in data_path[i] : #정상

target.append(0)

else:

target.append(1) #코로나

 

질문

위와 같이 사용을 하는데 데이터에 label값을 넣어주기전에 test, train, val로 나누어서 위에 같이 만들어야 하나요?

아니면 코로나, 정상폐 데이터를 데이터를 폴더 한 곳에 다 넣어서 라벨값을 만들고 데이터를 나누어야 할까요? (그리고 라벨값도 같이 randomstate를 똑같이 만들어서 나누어주기)

감사합니다

답변 2

0

엽강통강님의 프로필 이미지
엽강통강
질문자

#Keras Sequence기반의 Dataset 활용하여 Albumentations 적용하고 Xception, MobileNet으로 이미지 분류 수행 - 02

 

안녕하세요 선생님

선생님이 강의하신 내용을 토대로 실습연습을 하다가 데이터 경로(?) 부분이 조금 이해가 되지 않아서 질문을 드립니다

질문1.PNG질문2.PNG데이터를 train, test로 나누어서 선생님이 만드신 코드를 조정하고 있는데 데이터들이 데이터 프레임에 들어가지 않는데 저 output경로에다가 만들면 오류가 나오는건가요?

 

감사합니다

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

두가지 방법중에 어떤 걸 하셔도 비슷할 것 같습니다만,

다만 저라면 DataFrame으로 image file의 경로와 target 값을 각각 컬럼으로 만든 다음에 나중에 train, test, valid 로 분할을 해서 image file의 경로와 target 값을 나누는 방식을 할 것 같습니다(나중 강의에서 해당 방식으로 진행합니다)

아래 코드는 Pseudo 코드 입니다.

 

file_path_list = []

target_list = []

#코로나 이미지 파일의 경로와 target 값 지정.

corona_file_path_list = os.listdir("C:/Users/shingeon94/Desktop/5_test/data/COVID-19")

for file_path in corona_file_path_list:

file_path_list.append(file_path)

target_list.append(1)

#코로나가 아닌 이미지 파일의 경로와 target 값 지정.

non_corona_file_path_list = os.listdir("C:/Users/shingeon94/Desktop/5_test/data/Non-COVID-19")

for file_path in non_corona_file_path_list:

file_path_list.append(file_path)

target_list.append(1)

#이미지 파일 경로와 target 값을 가지는 메타 DataFrame

import pandas as pd

meta_dataframe = DataFrame()

meta_dataframe['image_file_path'] = file_path_list

meta_dataframe['target'] = target_list

 

해당 DataFrame을 나중에 train_test_split()등으로 분할해서 학습/테스트/검증 데이터로 만듭니다.

 

감사합니다.

 

엽강통강님의 프로필 이미지
엽강통강

작성한 질문수

질문하기