인프런 커뮤니티 질문&답변

하동주님의 프로필 이미지
하동주

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 1번 공부하다가 질문이 있어 남깁니다.

해결된 질문

작성

·

126

·

수정됨

0

안녕하세요. 작업형 1번 공부하다가 의문점이 있어 질문 남깁니다.

혹시 작업형 1번을 풀 때, 중간에 csv 파일을 제출하고 해당 csv 파일을 불러와서 다시 작업을 이어가도 괜찮을까요?

예를들어 행이 1~100까지의 DataFrame이 있는데 결측치 처리를 한다고 20개의 행을 날려서 80개의 행만 남았습니다. 근데 행이 중간중간 날라가서 index 번호를 보니까 0 1 2 4 6 7 8 10 이렇게 군데 군데가 비어있습니다. for문을 사용할 때, 해당 DataFrame을 loc으로 처리하면 중간에 비어있는 index 번호 때문에 오류가 납니다. 그래서 이렇게 결측치 처리된 csv 파일을 중간에 to_csv로 보내고, 해당 파일을 다시 불러오면 index가 0~80까지 이쁘게 나오더라고요. 혹시 이러한 방법이 문제가 될까요?

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

상관없을 것 같은데 추천하는 방식은 아닙니다.

인덱스 때문이라면 리셋 인덱스를 사용해 주세요

아래 예시

import pandas as pd # 데이터프레임 예시 생성 
df = pd.DataFrame({"A": range(100)}) # 결측치 처리를 가정하여 일부 행 제거 
df = df.drop(index=[3, 5, 9]) # 인덱스 재설정 
df = df.reset_index(drop=True) # 인덱스 확인 
print(df.head())

 

하동주님의 프로필 이미지
하동주
질문자

감사합니다!!

하동주님의 프로필 이미지
하동주

작성한 질문수

질문하기