태그: Ward 연결법
이 태그가 포함된 글들입니다. (총 1개)
Ward 연결법
Ward 연결법 (Ward Linkage) #
Ward 연결법은 계층적 클러스터링에서 사용되는 연결 기준(linkage criterion) 중 하나로, 클러스터 내 분산의 증가를 최소화하는 방향으로 클러스터를 병합하는 방법이다. 이 방법은 비교적 균등한 크기의 구형 클러스터를 생성하는 경향이 있다.
주요 개념 #
- 클러스터 내 제곱합 (Within-cluster Sum of Squares, WSS): 각 클러스터 내 데이터 포인트들과 클러스터 중심 간의 거리 제곱합이다.
- Ward 거리: 두 클러스터를 병합했을 때 증가하는 WSS의 양을 의미한다.
- 분산 최소화: 병합 시 전체 분산의 증가량을 최소화하는 것을 목표로 한다.
알고리즘 특징 #
- 각 단계에서 클러스터 내 분산의 증가를 최소화하는 두 클러스터를 병합한다.
- 덴드로그램(dendrogram)을 생성하여 계층적 구조를 시각화할 수 있다.
- 비교적 균등한 크기의 클러스터를 형성하는 경향이 있다.
- 구형에 가까운 클러스터에 가장 적합하다.
계산 방법 #
두 클러스터 A와 B를 병합할 때의 Ward 거리는 다음과 같이 계산된다: