인프런 커뮤니티 질문&답변

성한님의 프로필 이미지
성한

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의고사 풀어보기 (구 버전 help dir 예시문제)

작업형2 시험자에서 제출할때

해결된 질문

작성

·

203

0

마지막 부분에서 저의 코드는 pred = rf.predict(test)submit = pd.DataFrame({ 'index': test.index, 'target': pred})submit.to_csv("수험번호.csv" , index = False)인데 여기서 submit.to_csv까지만 적고 제출해도 되나요??  추가적으로 강의 코드를 보면.....rf.fit(X_tr, y_tr)pred =rf.predict(X_val)  pred=rf.predcit(test)submit = .... 이런 코드에서 pred 가 2개 중복인데 어떻게 해석해야하나요??

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

최종적으로 예측해야 할 값은 test데이터 입니다. X_val 데이터는 자체 평가하기 위한 용도에요

pred=rf.predcit(test)가 최종입니다.

질문을 주실 때 코드는 코드 블럭을 선택 후 작성해 주시면 감사하겠습니다 :) 코드가 한 줄로 적혀 있어 제가 질문을 정확히 이해하기가 어려운 부분이 있어요 🙏
image

성한님의 프로필 이미지
성한
질문자

아아 넵!! 정리해서 다시 질문드리겠습니다

Q1. submit.to_csv까지만 적고 제출해도 되나요??  아니면 pd.read_csv("수험번호.csv")까지 적어서 제출해야 하나요?

 

Q2. pred 가 연속으로 두번 쓰여도 되는 지 궁금합니다. 코드 블록을 봐주세요!

from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val)

pred = rf.predict(test)
submit = pd.DataFrame({"index": test.index, "target": pred})
submit.to_csv("수험번호.csv")

위에 보시면 4,5번라인에 pred를 X_val로도 예측해보고 test로도 예측해보는데 실제 시험장에 가서는 pred = rf.predict(X_val)을 지우고 pred=rf.predict(test)로만 작성해야하나요??

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

pd.read_csv("result.csv", index=False)까지 작성해서 제출해야 합니다!!
문제에서 요구한 파일명은 반드시 작성해야하고 (5회부터 수험번호가 아닌 result와 같은 특정 단어로 하고 있어요)

인덱스도 False로 처리해야 합니다.

생성된 파일을
print(pd.read_csv("result.csv")) 로 마지막에 작성해서 확인해주세요

성한님의 프로필 이미지
성한

작성한 질문수

질문하기