해결된 질문
작성
·
144
·
수정됨
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
안녕하세요~
작업형2 모의문제2 : 에어비엔비 가격예측에서 2가지 질문드립니다.
작업형2 모의문제1에서는 CLIENTNUM로 인해서 과대적합 가능성이 있다고했는데 이번에는 id는 남겨놓고 host,name 등만 삭제하셨더라구요. 이번엔 ID를 남겨놓은 이유가 있을까요?
R2 score 값이 1에 가까울수록 좋은 모델이라고 알고 있었습니다. 질문을 찾아보니 모델 점수에 연연하지 말라고 하셨는데, 그래도 R2 SCORE값이 -값이 나오거나 0.01 정도로 나오면 시험볼 때 많이 불안할 것 같더라구요.. - 값이나 0.01 정도로 나와도 괜찮은 건가요?
답변 2
0
안녕하세요, 인프런 AI 인턴입니다.
total1997님의 질문에 대해, 이미 지식공유자께서 답변한 내용이 있는 관련 질문이 있어 추천드립니다.
ID 컬럼의 처리에 대한 질문과 관련해서는, “작업형2 모의문제 질문입니다 !“에서 다룬 내용이 유익할 것으로 보입니다. 질문자는 작업형 문제에서 ID 컬럼을 삭제하고, test 데이터에서는 ID를 복사하는 과정에 대해 궁금해 했습니다. 작업형 문제에서 ID 컬럼의 처리 방식은 문제의 성격과 전처리 당위에 따라 다를 수 있으며, 문제에서 제출 파일에 test ID를 포함해서 csv를 만들어야 할 경우, test ID를 남겨 두기 위해 처리하는 것입니다. 자세한 답변은 작업형2 모의문제 질문입니다 ! 링크에서 확인해보시기 바랍니다.
R2 Score 값에 대한 질문에 대해서는 “작업형2 모의문제2”에서 관련 답변을 찾아볼 수 있습니다. R2 값이 낮게 나오는 경우가 있지만, 고성능의 모델을 요구하지 않으며, 데이터셋의 특성상 R2 값이 매우 높게 나오기 어려운 경우도 있다고 설명합니다. 따라서 약간의 점수 향상만으로도 충분히 의미가 있다는 관점을 제안합니다. 이와 관련된 더 상세한 답변은 작업형2 모의문제2 링크를 통해 확인 가능합니다.
각 질문의 핵심에 대해 간략히 요약하자면, ID 컬럼의 처리는 문제 설정과 제출 요구 사항에 따라 다를 수 있으며, R2 Score에 대해 너무 걱정하지 않아도 될 상황들이 있음을 이해하는 것이 중요합니다. 이러한 점에서 해당 링크들이 total1997님의 질문에 대한 답변을 제공할 수 있을 것으로 기대됩니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
답변 감사합니다~
제가 말을 잘못했는데, 작업형2 모의문제1에서 ID가 아니라 CLIENTNUM 였고, 11:00에 OVERFITTING 가능성이 있다고 하였습니다~