작성
·
242
0
안녕하세요
선생님께서 해당 강의의 다른 질문 댓글에 책에 있는대로 지니 계수가 낮은 속성을 기준으로 분할한다고 설명해주셨는데
제 책에는 "...지니계수가 높은 속성을 기준으로 분할하는 것입니다."라고 나오는데 제 책이 잘못된걸까요?
제가 이해한 바로는 지니계수가 낮으면 데이터 균일도가 낮으며 다양성이 높다고 해석됩니다. 이때는 지니계수가 0에 가깝고요.
반대로 데이터 균일도가 높을 때는 지니계수가 1에 가까우며 데이터 다양성이 낮다고 판단됩니다.
제가 잘못이해한 부분이 있다면 설명 부탁드려도 될까요?
답변 4
1
1
지니 계수가 낮은 값을 기준으로 분할합니다로 수정되었습니다.
가지고 계신 책이 초판이라 지니 계수가 높은 값으로 되어 있을 것입니다. 강의 역시 초판 내용이 담겨서 그렇습니다. 개정판에는 낮은 값 기준으로 되어 있습니다. 강의 영상 수정 후 편집을 맡겼는데, 다음주 월요일까지 된다고 하니 월요일에는 수정된 영상을 보실수 있습니다.
감사합니다.
1
0