인프런 커뮤니티 질문&답변

J I Park님의 프로필 이미지
J I Park

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

데이터 전처리 작업시 조건에 따른 특정값 채우는 방법?

해결된 질문

작성

·

110

0

해당 문제 연습하는 도중에 train과 test 데이터셋에 총구매액이 0원보다 작은 데이터가 있습니다.

해당 데이터를 0원으로 채우는(변환) 방법을 알고 싶습니다.

  • 결측치의 경우 fillna()로 쉽게 채울 수 있는데 결측치가 아닌 데이터의 조건에 따른 특정값으로 채우는 방법이 궁금합니다스크린샷 2024-06-14 134105.png

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

어떤 근거로 값을 변경하려는 걸까요? 파생변수는 생성해도 이렇게 값을 임의로 변경하지는 않아요

만약 변경한다면 아래와 같이 사용할 수 있어요

# 예를 들어, 열 'A'의 값이 3보다 큰 경우 열 'B'의 값을 999로 변경
df.loc[df['A'] > 3, 'B'] = 999
J I Park님의 프로필 이미지
J I Park
질문자

해당 데이터셋에서 음수로 표시되는 총구매액은 이상치로 판단되서 이상치를 제거하지 않고 특정값으로 대체하는 방법이 궁금했고, 또 유사한 문제가 1유형에서 나올 수도 있을 거 같아서 질의드렸습니다.

알려주신 방법으로 잘 해결했습니다.

감사합니다.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

넵!! 작업형1에선 나올 수 있습니다 🙂

작업형2의 이상치는 문제에서 명시하지 않으면 하지 않는 것을 추천해요~

해당 도메인 전문가가 아닌이상 이유가 있는 데이터 일 수도 있습니다.

J I Park님의 프로필 이미지
J I Park

작성한 질문수

질문하기