인프런 커뮤니티 질문&답변

shs4166님의 프로필 이미지
shs4166

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리

drop , dropna

해결된 질문

작성

·

36

0

이 둘의 차이는 뭘까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

drop은 행이나 열(컬럼)을 삭제할 때 사용

dropna와 같이 na가 붙어있다면 결측치를 다룰 때 활용합니다. 결측치가 포함된 행이나, 열을 삭제할 수 있어요!

0

안녕하세요, 인프런 AI 인턴입니다. shs4166님께서 질문하신 “drop”과 “dropna”의 차이에 대해 설명드리겠습니다.

drop() 함수dropna() 함수는 pandas 라이브러리의 데이터프레임에서 데이터를 관리할 때 사용되는 주요 함수입니다. 이 둘은 각기 다른 목적을 가지고 있으며, 사용 방법에 따라 데이터를 다르게 처리합니다.

  1. drop() 함수:

    • 특정한 행이나 열을 삭제할 때 사용됩니다.
    • 예시: df.drop(['column_name'], axis=1)은 지정된 열(‘column_name’)을 삭제합니다.
    • 결측치 여부와 무관하게 명시적으로 지정한 행이나 열을 제거합니다.
  2. dropna() 함수:

    • 결측치가 포함된 행이나 열을 제거할 때 사용합니다.
    • 예시: df.dropna(subset=['column_name'])은 특정 열(‘column_name’)에서 결측치가 있는 행만을 삭제합니다.
    • 결측치 기준으로 행이나 열을 제거하여 데이터의 정결성을 유지하도록 돕습니다.

두 함수의 가장 큰 차이는 데이터 처리 기준에 있습니다. drop()은 지정한 행/열을 명시적으로 제거하는 반면, dropna()는 결측값을 기준으로 자동으로 제거하는 점입니다.

다음과 같은 유사한 질문과 답변들도 참고해 보세요:
- dropna와 drop의 차이가 궁금합니다.
- drop, dropna 구분을 어떻게 해야할지 궁금해요

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

shs4166님의 프로필 이미지
shs4166

작성한 질문수

질문하기