인프런 커뮤니티 질문&답변

jongho님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제1

작업형1모의문제1 - 문제3 질문

해결된 질문

24.05.28 17:50 작성

·

103

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

문제3의 변환 과정에서 아래와 같이 코드를 짜도 문제 없는건가요? 결과값은 동일합니다.

 

df['f3'] = df['f3'].fillna(0)
df['f3'] = df['f3'].replace('silver', 1).replace('gold', 2).replace('vip', 3)


그리고 pandas에서 sum을 1번처럼 작성하는걸 더 권장한다고 들었는데 어떤 차이가 있는 건가요?

1. print(df['f3'].sum())
2. print(sum(df['f3']))

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 05. 28. 20:41

  1. 네 문제 없습니다.

  2. 결과의 차이는 없습니다. 1은 판다스에서 제공하는 sum()이고 2는 파이썬에서 제공하는 sum()입니다.

     

0

인프런 AI 인턴님의 프로필 이미지

2024. 05. 28. 17:56

안녕하세요, 인프런 AI 인턴입니다.

질문하신 내용에 대해 비슷한 질문과 그에 대한 답변을 찾았습니다. 이는 “[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)” 강의 내용과 관련이 있어 질문 주셨던 "작업형1모의문제1 - 문제3 질문"과 관련이 있습니다.

  1. 문제3 변환과정 관련하여: "f3" 컬럼의 결측값을 0으로 채우고, replace 메소드를 사용해 다른 값을 변경하는 과정은 정상입니다.

    • 관련 질문과 답변에 대한 링크는 다음과 같습니다: 문제3 변환 관련 문의
      견해에 따르면, numpy 라이브러리를 명시적으로 호출하지 않아도 되는 경우(예: np.nan)가 있으며, replace를 사용할 때 동일한 결과를 얻을 수 있습니다. 이는 replace 메소드를 사용해서 'silver', 'gold', 'vip'을 각각 1, 2, 3으로 치환하는 과정이 적절하게 사용된 예입니다.
  2. pandas의 sum()과 내장 함수 sum()의 사용 차이에 대하여: pandas의 sum() 메소드는 pandas 시리즈나 데이터프레임에 대해 최적화된 연산을 수행하며, 내부적으로 데이터 처리 속도를 향상시키는 로직이 포함되어 있습니다. 반면, 내장 함수 sum()은 일반적인 Python iterable에 대해 동작하므로, pandas 객체에 사용 시 성능이 다소 떨어질 수 있습니다. 따라서 pandas 객체에는 pandas의 sum() 메소드 사용을 권장합니다.

    • 상세한 설명은 특정하게 링크된 대답에서 직접적으로 찾을 수 없으므로, pandas 공식 문서나 기타 Python 관련 문서를 참조하시는 것이 좋습니다.

질문하신 내용을 바탕으로, 제시하신 코드와 방법은 문제가 없으며, pandas에서 제공하는 메소드를 사용하는 것이 일반적으로 더 권장되는 사례입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

jongho님의 프로필 이미지

작성한 질문수

질문하기