Clustering

태그: Clustering

이 태그가 포함된 글들입니다. (총 1개)

군집분석

군집분석(Clustering)이란? #

군집분석, 군집화, 클러스터링(Clustering)은 모두 본질적으로 같은 의미로 사용된다. 통계학에서는 주로 ‘군집분석’이라는 용어를, 기계학습(머신러닝)에서는 ‘클러스터링’이라는 용어를 사용하며, ‘군집화’는 클러스터링의 한국어 번역이다. 패턴인식 분야에서는 클러스터링을 ‘양자화(Quantization)’ 또는 ‘코딩(Coding)‘이라고 부르기도 한다.

실무에서는 "군집화"가 아닌 "클러스터링"이라고 부르는 경우가 더 많다.

클러스터링은 주어진 데이터(개체, 객체)들을 유사한 특성을 가진 그룹(군집, 클러스터)으로 자동으로 묶는 비지도학습(Unsupervised Learning) 기법 중 하나다. 즉, 사전에 정답(레이블)이 없는 데이터에서 데이터 간의 유사성 또는 거리 등을 기준으로 여러 개의 집단으로 나누는 방법이다. 이 과정에서 각 군집 내의 데이터는 서로 비슷하고, 군집 간에는 차이가 크도록 그룹화하는 것이 목표다.