인프런 커뮤니티 질문&답변

bloomingdiana님의 프로필 이미지
bloomingdiana

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

분류(Classification) 개요와 결정트리(Decision Tree) 소개

지니계수

작성

·

242

0

안녕하세요

선생님께서 해당 강의의 다른 질문 댓글에 책에 있는대로  지니 계수가 낮은 속성을 기준으로 분할한다고 설명해주셨는데

제 책에는 "...지니계수가 높은 속성을 기준으로 분할하는 것입니다."라고 나오는데 제 책이 잘못된걸까요?

제가 이해한 바로는 지니계수가 낮으면 데이터 균일도가 낮으며 다양성이 높다고 해석됩니다. 이때는 지니계수가 0에 가깝고요.

반대로 데이터 균일도가 높을 때는 지니계수가 1에 가까우며 데이터 다양성이 낮다고 판단됩니다. 

제가 잘못이해한 부분이 있다면 설명 부탁드려도 될까요?

답변 4

1

권 철민님의 프로필 이미지
권 철민
지식공유자

강의 영상 수정해서 올렸습니다. 감사합니다. ^^

1

권 철민님의 프로필 이미지
권 철민
지식공유자

지니 계수가 낮은 값을 기준으로 분할합니다로 수정되었습니다.

가지고 계신 책이 초판이라 지니 계수가 높은 값으로 되어 있을 것입니다. 강의 역시 초판 내용이 담겨서 그렇습니다. 개정판에는 낮은 값 기준으로 되어 있습니다. 강의 영상 수정 후 편집을 맡겼는데,  다음주 월요일까지 된다고 하니 월요일에는 수정된 영상을 보실수 있습니다.

감사합니다.

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

제가 강의 영상을 고쳤어야 했는데, 그러질 못했습니다. 책에 써있는 내용이 맞습니다.

주말까지 수정하도록 하겠습니다.

지적해 주셔서 감사합니다.

0

bloomingdiana님의 프로필 이미지
bloomingdiana
질문자

빠른 답변과 꼼꼼한 피드백 감사드립니다:)

bloomingdiana님의 프로필 이미지
bloomingdiana

작성한 질문수

질문하기