표본추출

표본추출 - Sampling #

정의와 개념 #

모집단(Population)의 특성을 파악하기 위해서 일부를 채집한 것을 **표본(Sample)**이라고 한다. 표본을 채집하는 것을 **표본추출(Sampling)**이라고 하고, 표본을 한국어로 표집이라고도 한다.

표본추출의 목적 #

  1. 비용 절약: 전수조사보다 경제적
  2. 시간 단축: 빠른 결과 도출 가능
  3. 정확성 향상: 소수의 표본에 집중하여 더 정확한 측정 가능
  4. 실용성: 전수조사가 불가능한 경우의 대안

표본추출의 기본 원리 #

  • 대표성(Representativeness): 표본이 모집단을 잘 대표해야 함
  • 무작위성(Randomness): 편향을 방지하기 위한 무작위 선택
  • 적절한 표본 크기: 통계적 유의성을 확보할 수 있는 충분한 크기

표본추출 방법의 분류 #

1. 확률표본추출 (Probability Sampling) #

모집단의 각 개체가 표본으로 선택될 확률이 알려져 있는 방법

1.1 단순무작위표본추출 (Simple Random Sampling) #

  • 모집단의 모든 개체가 동일한 확률로 선택되는 방법
  • 가장 기본적인 표본추출 방법
  • 장점: 편향이 없고 이론적으로 가장 이상적
  • 단점: 모집단 명부가 필요하고 실행이 어려울 수 있음

1.2 계통표본추출 (Systematic Sampling) #

  • 일정한 간격으로 표본을 선택하는 방법
  • 표본간격 = 모집단 크기 ÷ 표본 크기
  • 장점: 실행이 간단하고 모집단 전체에 고르게 분포
  • 단점: 주기성이 있는 모집단에서는 편향 가능

1.3 층화표본추출 (Stratified Sampling) #

  • 모집단을 동질적인 층(Stratum)으로 나누고 각 층에서 표본 추출
  • 비례층화: 각 층의 크기에 비례하여 표본 배분
  • 최적층화: 각 층의 분산을 고려하여 표본 배분
  • 장점: 정확도가 높고 각 층의 특성 파악 가능
  • 단점: 층화 기준 설정이 어렵고 복잡함

1.4 집락표본추출 (Cluster Sampling) #

  • 모집단을 집락(Cluster)으로 나누고 선택된 집락의 모든 개체를 조사
  • 1단계 집락표본추출: 선택된 집락의 모든 개체 조사
  • 다단계 집락표본추출: 선택된 집락에서 다시 표본 추출
  • 장점: 비용이 적게 들고 실행이 용이
  • 단점: 표본오차가 클 수 있음

2. 비확률표본추출 (Non-probability Sampling) #

선택 확률을 알 수 없거나 무작위가 아닌 방법

2.1 편의표본추출 (Convenience Sampling) #

  • 접근하기 쉬운 대상을 표본으로 선택
  • 장점: 빠르고 경제적
  • 단점: 편향이 심하고 일반화 어려움

2.2 판단표본추출 (Judgmental Sampling) #

  • 연구자의 판단에 따라 표본 선택
  • 장점: 전문적 지식 활용 가능
  • 단점: 주관적 편향 가능성

2.3 할당표본추출 (Quota Sampling) #

  • 특정 기준에 따라 할당량을 정하고 표본 선택
  • 장점: 층화표본추출과 유사한 효과
  • 단점: 무작위성 부족

2.4 눈덩이표본추출 (Snowball Sampling) #

  • 초기 응답자가 다른 응답자를 소개하는 방식
  • 장점: 접근하기 어려운 모집단에 유용
  • 단점: 편향이 심하고 대표성 부족

표본 크기 결정 #

영향 요인 #

  1. 신뢰수준 (Confidence Level): 일반적으로 95% 또는 99%
  2. 오차한계 (Margin of Error): 허용 가능한 오차 범위
  3. 모집단 분산: 클수록 더 큰 표본 필요
  4. 모집단 크기: 매우 클 때는 영향 미미

표본 크기 공식 (단순무작위표본추출) #

n = (Z²σ²) / E²
  • n: 표본 크기
  • Z: 신뢰수준에 해당하는 Z값
  • σ: 모집단 표준편차
  • E: 오차한계

표본오차와 비표본오차 #

표본오차 (Sampling Error) #

  • 표본추출로 인해 발생하는 오차
  • 표본 크기를 늘리면 감소
  • 통계적으로 측정 가능

비표본오차 (Non-sampling Error) #

  1. 선택편향: 특정 집단이 과대/과소 대표
  2. 무응답편향: 응답하지 않는 집단의 특성
  3. 측정오차: 잘못된 측정이나 기록
  4. 처리오차: 자료 처리 과정의 실수

표본추출의 실제 적용 #

여론조사 #

  • 층화표본추출 주로 사용
  • 지역, 연령, 성별 등으로 층화
  • 전화조사, 온라인조사 등 다양한 방법

품질관리 #

  • 계통표본추출 많이 사용
  • 생산라인에서 일정 간격으로 검사
  • 통계적 품질관리의 기초

시장조사 #

  • 할당표본추출 자주 사용
  • 목표 고객층별 할당
  • 편의표본추출도 예비조사에 활용

주의사항 #

  1. 표본추출틀의 정확성: 모집단을 정확히 반영하는 명부 필요
  2. 무응답 처리: 무응답률이 높으면 편향 발생 가능
  3. 표본 크기의 적절성: 너무 작으면 부정확, 너무 크면 비효율
  4. 추출방법의 선택: 연구 목적과 상황에 맞는 방법 선택

결론 #

표본추출은 통계학의 핵심 개념으로, 올바른 방법의 선택과 적용이 연구의 신뢰성을 좌우한다. 각 방법의 장단점을 이해하고 연구 상황에 맞는 최적의 표본추출 방법을 선택하는 것이 중요하다.