태그: 분할적
이 태그가 포함된 글들입니다. (총 1개)
계층적 군집화
계층적 군집화 (Hierarchical Clustering) #
계층적 군집화는 데이터를 계층적인 트리 구조(dendrogram)로 표현하여 클러스터를 구성하는 방법이다. 주요 방식은 두 가지가 있다:
- 병합적 방법 (Agglomerative): 각 데이터 포인트를 개별 클러스터로 시작하여, 가장 유사한 클러스터들을 반복적으로 병합한다.
- 분할적 방법 (Divisive): 전체 데이터를 하나의 클러스터로 시작하여, 점진적으로 클러스터를 분할해 나간다.
알고리즘 작동 원리 #
병합적 방법 (Agglomerative) 단계 #
- 각 데이터 포인트를 개별 클러스터로 초기화
- 모든 클러스터 쌍 간의 거리를 계산
- 가장 가까운 두 클러스터를 병합
- 새로운 클러스터와 다른 클러스터 간의 거리를 다시 계산
- 모든 데이터가 하나의 클러스터가 될 때까지 2-4단계를 반복
거리 측정 방법 #
클러스터 간의 거리를 측정하는 다양한 방법이 있다: