인프런 커뮤니티 질문&답변

빅분기수강생님의 프로필 이미지
빅분기수강생

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

corr() 실행 안됨

해결된 질문

작성

·

283

0

2강 판다스 corr() 오류.png이번에 복습하면서 처음부터 수업 다시 듣고 있는데요.

예전엔 corr()함수 오류없었는데, 이번엔 오류가 발생하더라고요. 혹시 상단에 코드 입력이 잘 못 되었나 일일이 다 확인해봤는데도 문제 없었고, 심지어 선생님 기본자료로 돌려봐도 똑같이 오류가 나오네요. corr() 실행 조건이 문자열 항목 있으면 안되게끔 바뀐거 같습니다. 예전에는 문자열 칼럼있어도 알아서 걸어서 계산했는데....

앞으로 어떻게 사용하면 좋을지 알려주시면 감사하겠습니다

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

안녕하세요!!

corr(), sum(), mean() 등 사용시

코랩 판다스가 업데이트 되면서 숫자외 문자 컬럼이 있을 때 에러(또는 워닝)가 발생하고 있어요!

numeric_only=True

를 괄호안에 사용하면 해결할 수 있으며, 현 시험환경 버전에서는 발생하지 않아요!

0

안녕하세요, 인프런 AI 인턴입니다.

빅분기수강생님의 corr() 함수 실행 중 발생한 오류에 대해 질문 주셨군요. 같은 강의에서 유사한 문제를 겪은 다른 수강생의 사례를 찾아봤습니다.

상관관계 분석에서 corr() 함수 사용 시 문자열 칼럼이 존재할 경우 발생할 수 있는 오류에 대한 해결 방법으로, pandas 버전에 따라 달라질 수 있는 처리 방법이 있습니다. 말씀하신 것처럼 최신 버전의 pandas에서는 문자열 칼럼을 자동으로 제외하지 않고, 상관 계수 계산 시 오류를 발생시킬 수 있습니다.

해당 문제에 대해 이전에 다른 수강생이 비슷한 문제를 제기했었고, 강사님이 제공한 답변이 유용할 것으로 보입니다. 특정한 해결 방안으로 pandas의 corr() 함수 실행 시 numeric_only=True 옵션을 추가하는 것입니다. 이 옵션을 사용하면 숫자형 데이터만 고려하여 상관 계수를 계산하고, 문자열 데이터는 자동으로 제외됩니다.

보다 구체적인 설명은 다음 링크에서 확인하실 수 있습니다:
- 상관관계 오류 - 강좌 내에서 제공된 데이터를 사용하여 df.corr() 함수 실행 시 발생할 수 있는 오류 및 해결 방법에 대해 설명하고 있습니다. 이 경우, df.corr(numeric_only=True)를 사용하여 숫자형 데이터에 대해서만 상관 계수를 계산하도록 설정할 수 있습니다.

해당 방법을 시도하여 보시고, 여전히 문제가 해결되지 않는 경우 추가적인 정보나 대안이 필요할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

빅분기수강생님의 프로필 이미지
빅분기수강생

작성한 질문수

질문하기