인프런 커뮤니티 질문&답변

hj2930hj님의 프로필 이미지
hj2930hj

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 시계열 데이터

해결된 질문

작성

·

98

0

시계열 데이터가 있으면 파생변수로 만들어 주라고 하셨는데, 여기서 질문이 있습니다

  1. 파생변수를 만들지 않고는 분석을 진행 못하나요?

  2. 만약 진행이 가능하다면 그냥 원핫인코딩이나 라벨인코딩 해주면 되나요? 아니면 drop시켜야 되나요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

이해가 되었을까요??🤔

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

 

  1. 파생변수를 만들지 않고는 분석을 진행 못하나요?


    아니요. 가능하다면 생성해달라고 작성했어요. 년, 월, 일 등의 컬럼은 예측력을 높일 수 있어요!

  2. 만약 진행이 가능하다면 그냥 원핫인코딩이나 라벨인코딩 해주면 되나요? 아니면 drop시켜야 되나요?


    새소식에 예시 코드를 작성해놨는데 인코딩이 아닌 년, 월, 일을 컬럼으로 생성하는 부분입니다. (작업형1에서도 여러번 수행했었음)

hj2930hj님의 프로필 이미지
hj2930hj
질문자

파생변수를 생성하지 않고, 그냥 원핫인코딩을 진행해도 된다는 뜻이신가요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아니요! 원핫인코딩 진행은 안됩니다.

만약 인코딩으로 처리 한다면 레이블 인코딩은 가능합니다.

hj2930hj님의 프로필 이미지
hj2930hj
질문자

그럼 시계열 데이터가 있는 데이터는 원핫인코딩대신 레이블 인코딩을 해줘야 풀 수 있는건가요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

뭔가 오해가 있는 것 같아요.

저는 문자로 된 내용을 말하고 있는 것이 아니라

2024-06-22와 같은 날짜 데이터를 말하고 있고, 이 데이터를 성능 향상을 위해년, 월, 일로 구분하는 것을 알려드렸어요!! 어렵다면 이부분은 패스하셔도 좋습니다.

(날짜 데이터를 라벨인코딩 처리는 불가능한 것은 아니나 위 방식을 추천합니다.)

그 외 범주형 데이터는 원핫, 라벨 아무거나 하셔도 좋습니다.

hj2930hj님의 프로필 이미지
hj2930hj

작성한 질문수

질문하기