3표준편차

3 sigma rule

개요 데이터의 분포를 정규분포로 가정하고(또는 우기고) 평균으로 부터 ±표준편차 * 시그마계수를 벗어나면 아웃라이어(outlier, 이상치)라고 판단하는 것을 말한다. 너무 단순한 것이라고 해서 최근에는 그대로 사용하는 경우는 거의 없지만 단순하지만 잘 작동한다. 시그마계수는 표준편차에 얼마를 곱할 것인가를 말하는데 보통 2 ~ 3의 값을 사용한다. 3시그마보다는 2시그마가 일반적으로 많이 알려져 있다. 다음과 같은 수치를 연상하면 기억하기 쉽다. 2SD, 2시그마: 약 95% 신뢰도 3SD, 3시그마: 약 99% 신뢰도 6SD, 6시그마: 약 99.999999% 신뢰도 이와 관련된 것은 위키피디아의 68-95-99. »