해결된 질문
작성
·
106
답변 2
0
0
파생변수를 만들지 않고는 분석을 진행 못하나요?
아니요. 가능하다면 생성해달라고 작성했어요. 년, 월, 일 등의 컬럼은 예측력을 높일 수 있어요!
만약 진행이 가능하다면 그냥 원핫인코딩이나 라벨인코딩 해주면 되나요? 아니면 drop시켜야 되나요?
새소식에 예시 코드를 작성해놨는데 인코딩이 아닌 년, 월, 일을 컬럼으로 생성하는 부분입니다. (작업형1에서도 여러번 수행했었음)
뭔가 오해가 있는 것 같아요.
저는 문자로 된 내용을 말하고 있는 것이 아니라
2024-06-22와 같은 날짜 데이터를 말하고 있고, 이 데이터를 성능 향상을 위해년, 월, 일로 구분하는 것을 알려드렸어요!! 어렵다면 이부분은 패스하셔도 좋습니다.
(날짜 데이터를 라벨인코딩 처리는 불가능한 것은 아니나 위 방식을 추천합니다.)
그 외 범주형 데이터는 원핫, 라벨 아무거나 하셔도 좋습니다.
파생변수를 생성하지 않고, 그냥 원핫인코딩을 진행해도 된다는 뜻이신가요?