인프런 커뮤니티 질문&답변

wsyang님의 프로필 이미지
wsyang

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[자주묻는질문] sum과 len 🆕 updated 2024.6

결측치 문의

해결된 질문

작성

·

29

0

예제 데이터 프레임에서 결측치를 np.nan으로 적어주셨는데,

결측치를 무조건 이렇게 사용해야 하는건가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아니요! 데이터 생성을 위해서 사용한 것으로

직접 결측치를 입력(np.nan)하는 작업은 시험에서 필요 없습니다.

결측치가 있는 데이터를 받게 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. wsyang님.

결측치는 pandas에서 np.nan을 사용하여 표기하는 것이 일반적입니다. 이는 데이터프레임 내에서 결측치를 일관되게 처리하기 위해 흔히 사용되는 방식입니다. np.nan을 사용하면 pandas의 여러 메서드와의 호환성이 좋으며, 결측치 처리에 유용한 fillna(), dropna()와 같은 함수를 효과적으로 활용할 수 있습니다.

하지만 꼭 np.nan만 써야 하는 것은 아닙니다. 결측치를 사용자 정의 값으로 지정할 수도 있습니다. 하지만, 주의해야 할 점은 이를 pandas의 다양한 결측치 처리 함수들과 함께 사용할 때의 호환성과 효율성입니다.

아래의 게시물들이 유사한 결측치 처리에 관한 논의를 하고 있어 참조하시면 도움이 될 것입니다:
- 결측값 처리 관련 궁금합니다

그리고 fillna()와 관련된 추가 정보는 다음 게시물을 참고하세요:
- fillna 함수 질문드립니다!

결론적으로, np.nan이 많이 쓰이는 한편, 도메인이나 데이터의 특성에 따라 다른 방법도 사용할 수 있습니다. 중요한 것은 일관되게 작성하여 이후 처리 시 혼란을 피하는 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

wsyang님의 프로필 이미지
wsyang

작성한 질문수

질문하기