해결된 질문
작성
·
174
0
sum을 사용할때 sum(값) 혹은 .sum( ) 이런식으로 두가지로 사용되던데 두가지의 차이가 있나요?
sum 에서 어떤 경우에는 합을, 어떤 경우에는 개수를 셀때 사용하던데 각각 어떤 경우에 보통 사용되는지 혹시 예시 코드를 알려주실수 있을까요?
원핫인코딩을 할 때 object 값만 넣는게 아니라 보통 전체 데이터셋을 넣어주나요?
만약에 object 값만 넣었을때랑 전체 데이터셋을 넣었을 때랑 차이가 있을까요?
관찰값과 기대값을 구분하는 법을 잘 모르겠습니다..!
관찰값과 기대값의 리스트 순서를 동일하게 맞추기 위해서 sort를 진행하는 건가요?
만약에 관찰값과 기대값의 순서가 다를 경우 결과에 크게 영향을 미칠까요?
문제를 보고 어떤부분을 봐야 적합도 검정인지 어떻게 알 수 있을까요?
문제를 보았을 때 정확히 무엇을 묻는(어떤 방식으로 풀어야하는지) 문제인지 구분하기가 힘든 것 같습니다..
적합도 검정뿐만 아니라 회귀분석/분산분석/ 독립성 검정 문제에서 정확히 어떤 부분을 보고 회귀 분석이다! 아니면 독립성 검정이다! 를 알 수 있을까요? 개념이 정확히 정리가 안된 것 같은데 .. 문제를 보고 구분하는 방법을 알려주시면 감사하겠습니다.. ㅜㅠ
groupby(~~).mean() 형태로 많이 쓰이던데 mean 말고 다른 것도 사용할 수 있는지, mean 밖에 안되는지 궁금합니다. 다른 것도 사용할 수 있으면 어떤게 있는지 알려주세요!
질문이 너무 많네요..!! 답변 부탁드립니다
답변 1
0
1 큰 차이 없이 일반적으로 둘 다 사용가능합니다.
2 sum은 개수를 세는 함수가 아니라 총합을 계산하는 함수에요 개수를 파악하는 것 처럼 보일 때는 sum(조건식)일 때 조건식에서 True 또는 False를 반환합니다. 이때 True는 1이고 False는 0입니다.
3 네 전체를 넣는 것이 편합니다. 전체를 넣었을 때는 object값만 인코딩하고 수치형과 함께 반환함. object값만 넣었을 때는 object가 인코딩된 값만 반환됨
4 관찰값(Observed value): 실제 관찰된 데이터 값입니다.기대값(Expected value): 이론적이거나 모델에 의해 예상되는 값입니다.
5 일반적으로 순서를 꼬아서 출제하진 않아요.
6 적합도 검정은 주로 이론적 분포나 예상 분포와 관찰된 데이터 분포를 비교할 때 사용합니다
7 작업형3은 노션을 공유하고 있습니다. 해당 내용을 참고 부탁드릴게요! 그리고 문제에서 일반적으로 알려주고 있어요
8 .sum()
, .min()
, .max()
, .count()
, .median()
가 있습니다.