인프런 커뮤니티 질문&답변

inflearn님의 프로필 이미지
inflearn

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

여러가지 질문

해결된 질문

작성

·

174

0

  1. sum을 사용할때 sum(값) 혹은 .sum( ) 이런식으로 두가지로 사용되던데 두가지의 차이가 있나요?

  2. sum 에서 어떤 경우에는 합을, 어떤 경우에는 개수를 셀때 사용하던데 각각 어떤 경우에 보통 사용되는지 혹시 예시 코드를 알려주실수 있을까요?

     

  3. 원핫인코딩을 할 때 object 값만 넣는게 아니라 보통 전체 데이터셋을 넣어주나요?

    1. 만약에 object 값만 넣었을때랑 전체 데이터셋을 넣었을 때랑 차이가 있을까요?

  4. 관찰값과 기대값을 구분하는 법을 잘 모르겠습니다..!

     

  5. 관찰값과 기대값의 리스트 순서를 동일하게 맞추기 위해서 sort를 진행하는 건가요?

    1. 만약에 관찰값과 기대값의 순서가 다를 경우 결과에 크게 영향을 미칠까요?

  6. 문제를 보고 어떤부분을 봐야 적합도 검정인지 어떻게 알 수 있을까요?

  7. 문제를 보았을 때 정확히 무엇을 묻는(어떤 방식으로 풀어야하는지) 문제인지 구분하기가 힘든 것 같습니다..

    적합도 검정뿐만 아니라 회귀분석/분산분석/ 독립성 검정 문제에서 정확히 어떤 부분을 보고 회귀 분석이다! 아니면 독립성 검정이다! 를 알 수 있을까요? 개념이 정확히 정리가 안된 것 같은데 .. 문제를 보고 구분하는 방법을 알려주시면 감사하겠습니다.. ㅜㅠ

  8. groupby(~~).mean() 형태로 많이 쓰이던데 mean 말고 다른 것도 사용할 수 있는지, mean 밖에 안되는지 궁금합니다. 다른 것도 사용할 수 있으면 어떤게 있는지 알려주세요!

 

질문이 너무 많네요..!! 답변 부탁드립니다

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1 큰 차이 없이 일반적으로 둘 다 사용가능합니다.

2 sum은 개수를 세는 함수가 아니라 총합을 계산하는 함수에요 개수를 파악하는 것 처럼 보일 때는 sum(조건식)일 때 조건식에서 True 또는 False를 반환합니다. 이때 True는 1이고 False는 0입니다.
3 네 전체를 넣는 것이 편합니다. 전체를 넣었을 때는 object값만 인코딩하고 수치형과 함께 반환함. object값만 넣었을 때는 object가 인코딩된 값만 반환됨

4 관찰값(Observed value): 실제 관찰된 데이터 값입니다.기대값(Expected value): 이론적이거나 모델에 의해 예상되는 값입니다.

5 일반적으로 순서를 꼬아서 출제하진 않아요.

6 적합도 검정은 주로 이론적 분포나 예상 분포와 관찰된 데이터 분포를 비교할 때 사용합니다

7 작업형3은 노션을 공유하고 있습니다. 해당 내용을 참고 부탁드릴게요! 그리고 문제에서 일반적으로 알려주고 있어요

8 .sum(), .min(), .max(), .count(), .median() 가 있습니다.

inflearn님의 프로필 이미지
inflearn

작성한 질문수

질문하기