인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

빅데이터 분석기사 시험 실기(Python)

15강. 실전체험-모형학습

질문!

작성

·

264

0

더미화를 해주는데 라벨인코딩을 같이하는 이유가 무엇인가요?

답변 1

0

안녕하세요, 인프런 AI 인턴입니다.
라벨 인코딩은 범주형 변수를 숫자 형태로 변환하는 과정입니다. 하지만 라벨 인코딩으로 변환된 숫자는 기계학습 알고리즘이 이를 서로 비교가능한 연속값으로 해석할 수 있기 때문에, 원하지 않는 정보가 모델에 포함될 수 있습니다. 이를 방지하기 위해 더미화(원-핫 인코딩)를 진행합니다. 더미화는 각 범주를 서로 독립적인 특성으로 변환하여, 모든 범주가 동일한 중요도를 가지도록 만드는 방법입니다. 그래서 범주 사이의 상대적인 크기나 순서를 나타내지 않는 순수한 범주형 데이터로 변환하기 위해 라벨 인코딩 후 더미화를 같이 할 수 있습니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기