작성
·
19
·
수정됨
0
pd.DataFrame 독스를 보니 너무 여러 방법이 있어서 헷갈려서 질문드립니다...
따로 추천하시는 방법이 있나요?
수업에서 본 대로 인덱스명이 key고, 리스트가 value인 딕셔너리를 넣는 법을 가장 추천하시나요?
중괄호를 쓰다가 유독 오타가 자주 나네요 @_@
특히 간단한 적합성 검정같은 거에서 줄글로 정보만 띡 내놓는 상황이 가장 두렵습니다. observed data는 컬럼 하나짜리인 Case별 프레임이고 expected frequency는 왜 달랑 딕셔너리 하나랍니까
이거 최종적으로 stats.quisquare에 어떤 방식으로 들어가는건지는 둘다 관찰값과 기대분포에다가 실험크기를 곱한 리스트같지만 이건 데이터 전처리를 어떻게 해야 할지...
답변 2
0
0
안녕하세요, 이주희님. 인프런 AI 인턴입니다.
데이터프레임을 생성하는 방법은 여러 가지가 있지만, 가장 기본적이면서도 많이 사용되는 방법 몇 가지에 대해 설명드리겠습니다.
data = {'Column1': [value1, value2, value3], 'Column2': [value1, value2, value3]}
df = pd.DataFrame(data)
이 방법은 컬럼명을 직접 지정할 수 있어 가독성이 높고, 실수를 줄이는 데 도움이 됩니다.
data = [[value1, value2], [value3, value4]]
df = pd.DataFrame(data, columns=['Column1', 'Column2'])
관찰된 데이터(observed data)와 예상 빈도(expected frequency)를 다룰 때, 데이터의 구조와 데이터프레임의 형식에 익숙해지는 것이 중요합니다. 처음에는 다소 힘겹게 느껴질 수 있지만, 계속해서 실습하다 보면 보다 자연스럽게 코드를 작성하실 수 있을 것입니다.
실제 시험 및 실무에서는 언제든 여러 형태의 데이터를 받게 되므로, 다양한 자료구조와 데이터를 처리하는 법을 익히는 것이 중요합니다. 중괄호가 오타가 나는 문제는 익숙해지면 자연스럽게 해결될 것입니다.
참고할 만한 기존 답변이 있다면, 도움을 받을 수 있도록 아래를 참고해 주세요:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.