표본추출 - Sampling #
정의와 개념 #
모집단(Population)의 특성을 파악하기 위해서 일부를 채집한 것을 **표본(Sample)**이라고 한다. 표본을 채집하는 것을 **표본추출(Sampling)**이라고 하고, 표본을 한국어로 표집이라고도 한다.
표본추출의 목적 #
- 비용 절약: 전수조사보다 경제적
- 시간 단축: 빠른 결과 도출 가능
- 정확성 향상: 소수의 표본에 집중하여 더 정확한 측정 가능
- 실용성: 전수조사가 불가능한 경우의 대안
표본추출의 기본 원리 #
- 대표성(Representativeness): 표본이 모집단을 잘 대표해야 함
- 무작위성(Randomness): 편향을 방지하기 위한 무작위 선택
- 적절한 표본 크기: 통계적 유의성을 확보할 수 있는 충분한 크기
표본추출 방법의 분류 #
1. 확률표본추출 (Probability Sampling) #
모집단의 각 개체가 표본으로 선택될 확률이 알려져 있는 방법
1.1 단순무작위표본추출 (Simple Random Sampling) #
- 모집단의 모든 개체가 동일한 확률로 선택되는 방법
- 가장 기본적인 표본추출 방법
- 장점: 편향이 없고 이론적으로 가장 이상적
- 단점: 모집단 명부가 필요하고 실행이 어려울 수 있음
1.2 계통표본추출 (Systematic Sampling) #
- 일정한 간격으로 표본을 선택하는 방법
- 표본간격 = 모집단 크기 ÷ 표본 크기
- 장점: 실행이 간단하고 모집단 전체에 고르게 분포
- 단점: 주기성이 있는 모집단에서는 편향 가능
1.3 층화표본추출 (Stratified Sampling) #
- 모집단을 동질적인 층(Stratum)으로 나누고 각 층에서 표본 추출
- 비례층화: 각 층의 크기에 비례하여 표본 배분
- 최적층화: 각 층의 분산을 고려하여 표본 배분
- 장점: 정확도가 높고 각 층의 특성 파악 가능
- 단점: 층화 기준 설정이 어렵고 복잡함
1.4 집락표본추출 (Cluster Sampling) #
- 모집단을 집락(Cluster)으로 나누고 선택된 집락의 모든 개체를 조사
- 1단계 집락표본추출: 선택된 집락의 모든 개체 조사
- 다단계 집락표본추출: 선택된 집락에서 다시 표본 추출
- 장점: 비용이 적게 들고 실행이 용이
- 단점: 표본오차가 클 수 있음
2. 비확률표본추출 (Non-probability Sampling) #
선택 확률을 알 수 없거나 무작위가 아닌 방법
2.1 편의표본추출 (Convenience Sampling) #
- 접근하기 쉬운 대상을 표본으로 선택
- 장점: 빠르고 경제적
- 단점: 편향이 심하고 일반화 어려움
2.2 판단표본추출 (Judgmental Sampling) #
- 연구자의 판단에 따라 표본 선택
- 장점: 전문적 지식 활용 가능
- 단점: 주관적 편향 가능성
2.3 할당표본추출 (Quota Sampling) #
- 특정 기준에 따라 할당량을 정하고 표본 선택
- 장점: 층화표본추출과 유사한 효과
- 단점: 무작위성 부족
2.4 눈덩이표본추출 (Snowball Sampling) #
- 초기 응답자가 다른 응답자를 소개하는 방식
- 장점: 접근하기 어려운 모집단에 유용
- 단점: 편향이 심하고 대표성 부족
표본 크기 결정 #
영향 요인 #
- 신뢰수준 (Confidence Level): 일반적으로 95% 또는 99%
- 오차한계 (Margin of Error): 허용 가능한 오차 범위
- 모집단 분산: 클수록 더 큰 표본 필요
- 모집단 크기: 매우 클 때는 영향 미미
표본 크기 공식 (단순무작위표본추출) #
n = (Z²σ²) / E²
- n: 표본 크기
- Z: 신뢰수준에 해당하는 Z값
- σ: 모집단 표준편차
- E: 오차한계
표본오차와 비표본오차 #
표본오차 (Sampling Error) #
- 표본추출로 인해 발생하는 오차
- 표본 크기를 늘리면 감소
- 통계적으로 측정 가능
비표본오차 (Non-sampling Error) #
- 선택편향: 특정 집단이 과대/과소 대표
- 무응답편향: 응답하지 않는 집단의 특성
- 측정오차: 잘못된 측정이나 기록
- 처리오차: 자료 처리 과정의 실수
표본추출의 실제 적용 #
여론조사 #
- 층화표본추출 주로 사용
- 지역, 연령, 성별 등으로 층화
- 전화조사, 온라인조사 등 다양한 방법
품질관리 #
- 계통표본추출 많이 사용
- 생산라인에서 일정 간격으로 검사
- 통계적 품질관리의 기초
시장조사 #
- 할당표본추출 자주 사용
- 목표 고객층별 할당
- 편의표본추출도 예비조사에 활용
주의사항 #
- 표본추출틀의 정확성: 모집단을 정확히 반영하는 명부 필요
- 무응답 처리: 무응답률이 높으면 편향 발생 가능
- 표본 크기의 적절성: 너무 작으면 부정확, 너무 크면 비효율
- 추출방법의 선택: 연구 목적과 상황에 맞는 방법 선택
결론 #
표본추출은 통계학의 핵심 개념으로, 올바른 방법의 선택과 적용이 연구의 신뢰성을 좌우한다. 각 방법의 장단점을 이해하고 연구 상황에 맞는 최적의 표본추출 방법을 선택하는 것이 중요하다.