작성
·
918
1
안녕하세요 해당 강의를 수강하던 중 질문이 생겨 글 남깁니다.
답변 1
1
안녕하세요.
좋은 질문을 주셨네요.
판다스에서는 df.hist() 혹은 df.plot.hist()를 통해서 그래프를 시각화 할 수 있는데요.
같은 데이터를 가져와서 시각화를 하더라도 아래와 같은 차이가 있습니다.
데이터프레임.hist() => 전체 수치 변수에 대한 히스토그램을 서브플롯을 그립니다.
데이터프레임.plot.hist() => 전체 수치 변수에 대한 히스토그램을 하나의 그래프에 겹쳐서 그립니다.
plot.hist 에서 서브플롯을 그리면 아래와 같이 그려지는데요.
이때는 x축 값이 공유되기 때문에 수치에 따라 그래프의 모양이 해석하기 어렵게 그려지기도 합니다.
그래서 데이터프레임에 대한 히스토그램은 df.hist() 사용을 권장하며,
시리즈 데이터를 바로 히스토그램으로 그리고자 할 때는 df.plot.hist()를 사용해 보세요.
물론 두 가지 모두에 df.컬럼명.hist() 이렇게 사용하셔도 됩니다.
개인적으로는 히스토그램을 겹쳐서 그리고자 할때가 아니라면 df.hist() 사용이 데이터를 읽기에 좋습니다.