인프런 커뮤니티 질문&답변

태보미님의 프로필 이미지
태보미

작성한 질문수

파이썬을 활용한 머신러닝 딥러닝 입문

Clustering (군집화)

DBSCAN 질문

작성

·

118

0

늘 강의 잘 듣고 있습니다! DBSCAN에서 Radius(R)와 Minimum Neighbor number(M)을 가르쳐주시고 Core, Border 개념을 소개해주셨는데 헷갈리는 부분이 있어 질문 드립니다. pdf 자료를 보며 R에 2unit 이렇게 되어 있는데 이 Unit이라는 건 데이터 포인트의 점 크기를 말하는 걸까요? 그리고 정한 M 값 이상의 데이터 포인트들이 R 안에 들어오면 Core고 Border는 R안에 데이터포인트가 M 보다 작은 수만큼 있는 경우, 다른 Core가 R 안에 있는 경우를 말하는 건가요? (R안에 다른 데이터포인트가 하나라도 있으면 Border인지 궁금합니다)

답변 1

0

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

  • R의 'unit'은 데이터 포인트 간의 거리를 측정하는 데 사용되는 단위입니다. 단위는 데이터의 특성에 따라 달라집니다. 예를 들어, 위치 데이터의 경우 미터나 킬로미터가 될 수 있고, 다른 유형의 수치 데이터에서는 그 데이터의 단위를 따릅니다.따라서 데이터 포인트의 "점 크기"를 의미하는 것이 아니라, 사용된 데이터의 측정 단위(예: 거리, 금액 등)를 말합니다.

  • Border Point는 R 안에 최소 M개 미만의 이웃을 가지지만, Core Point의 영향 범위 내에 존재하는 포인트를 의미합니다. 단순히 R 안에 다른 데이터 포인트가 하나라도 있으면 Border Point가 되는 것은 아닙니다. 반드시 그 R 안에 있는 다른 포인트 중 적어도 하나가 Core Point여야 합니다.



    좋은 질문 감사합니다.

태보미님의 프로필 이미지
태보미

작성한 질문수

질문하기