해결된 질문
작성
·
1.2K
0
답변 1
4
drop
과 dropna
함수는 모두 pandas 라이브러리에서 데이터프레임을 다룰 때 사용되는 함수입니다. 두 함수의 용도와 사용 시나리오는 다음과 같습니다:
1. `dropna` 함수:
데이터프레임에서 결측치가 포함된 행이나 열을 제거하는 데 사용됩니다.
- df.dropna()
: 기본적으로 어떤 행에든 하나 이상의 결측치가 있으면 해당 행을 제거
- df.dropna(axis=1)
: 어떤 열에든 하나 이상의 결측치가 있으면 해당 열을 제거
- df.dropna(subset=['컬럼명'])
: 특정 열(여기서는 '컬럼명')에 결측치가 있는 행만 제거
2. `drop` 함수:
특정 행이나 열을 데이터프레임에서 제거하는 데 사용됩니다. 이 함수는 결측치 여부와 무관하게 지정된 행이나 열을 삭제합니다.
- df.drop(['컬럼명'], axis=1)
: 지정된 열(여기서는 '컬럼명')을 제거
- df.drop([index], axis=0)
: 지정된 행(여기서는 'index')을 제거
dropna
는 결측치를 기준으로 행이나 열을 제거하는 데 사용되며, drop
은 특정 행이나 열을 명시적으로 지정하여 제거하는 데 사용됩니다. 결측치 처리에 집중할 때는 dropna
를 사용하고, 데이터의 구조를 조정하거나 불필요한 부분을 제거할 때는 drop
을 사용합니다.