해결된 질문
작성
·
29
0
안녕하세요 결측치 관련 질문드립니다
1.시험에서 test 데이터가 주어질시
제가 test데이터 행을 삭제하지 않아야 하는것은 인지했습니다.
그러나 test 데이터의 결측치를 제 임의대로 값을 넣어도 되는것인가요?
강의를 보니 이상치를 컨트롤하는 케이스는 거의없으나
결측치는 object는 최빈값 int,float은 중앙값이나 0 을 대입하는데
모든경우에 통일되는 방법인가요?
혹은 시험장에서 여러가지 결측치 처리 방법을 전부 알고가서 하나하나 검증하며
가장 값이 높은걸 넣어야 하나요
시험장에서 A로 평가하겠다 하면 검증을 통해 나오는 수치가 A를통해 보통 몇 이상이 나와야 제출할수 있을까요?
답변 3
0
1
정확히 이해하셨습니다. test데이터 행삭제 금지
그외 모든 결측치 처리는 자유롭게 하되 검증데이터 성능을 기준으로 하면됩니다.
단 train과 test는 동일하게 처리해 주세요
2
시험에서 보통 몇 이상이란 것이 없습니다.
0.9점대가 40점이었을 때도 있고 0.6점대가 40점이었을 때도 있어요
데이터에 따라 달라집니다.
전처리를 최소화한 베이스라인점수를 기준으로 놓고
다른 전처리를 통해 개선이 되면 개선된 결과를 제출하고 아니면 베이스라인 코드를 제출하면 됩니다.
0
1
정확히 이해하셨습니다. test데이터 행삭제 금지
그외 모든 결측치 처리는 자유롭게 하되 검증데이터 성능을 기준으로 하면됩니다.
단 train과 test는 동일하게 처리해 주세요
2
시험에서 보통 몇 이상이란 것이 없습니다.
0.9점대가 40점이었을 때도 있고 0.6점대가 40점이었을 때도 있어요
데이터에 따라 달라집니다.
전처리를 최소화한 베이스라인점수를 기준으로 놓고
다른 전처리를 통해 개선이 되면 개선된 결과를 제출하고 아니면 베이스라인 코드를 제출하면 됩니다.
0
안녕하세요, 인프런 AI 인턴입니다. 김호준님의 결측치 처리 관련 질문에 대해 답변 드리겠습니다.
결론적으로, 시험 환경에서 결측치 처리를 할 때는 몇 가지 중요한 요소를 고려해야 합니다.
결측치 대체 방법:
테스트 데이터의 결측치 처리:
여러 결측치 처리 방법의 검토:
시험에서의 스코어링
작업형 시험 환경에서는 처리 방법 자체보다는 방법의 일관성과 그것이 자주 사용되는 목적이 더 중요합니다. 데이터를 해석하고, 그 특성에 맞게 처리하는 능력을 보여주는 것이 목표입니다.
관련 질문 링크로는 아래를 참고해 보세요:
- test 데이터의 결측치 처리: 해당 링크를 확인해 보시면 비슷한 결측치, 이상치 처리에 대한 논의가 진행되었습니다.
김호준님이 추가적으로 참고할 수 있는 링크들을 통해 더 심도 깊은 이해를 도모하기 바랍니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.