로그로그베타

로그로그베타 - Log log beta #

개요 #

로그로그베타 분포(Log-logistic beta distribution)는 베타 분포의 변형으로, 생존 분석과 신뢰성 분석에서 널리 사용되는 확률 분포입니다. 이 분포는 특히 생존 시간 모델링과 위험률 분석에서 중요한 역할을 합니다.

수학적 정의 #

로그로그베타 분포의 확률밀도함수(PDF)는 다음과 같이 정의됩니다:

$$f(x; \alpha, \beta) = \frac{\beta}{\alpha} \left(\frac{x}{\alpha}\right)^{\beta-1} \left[1 + \left(\frac{x}{\alpha}\right)^{\beta}\right]^{-2}$$

여기서:

$x > 0$ (지지집합)
$\alpha > 0$ (척도 모수, scale parameter)
$\beta > 0$ (형태 모수, shape parameter)

누적분포함수 (CDF) #

$$F(x; \alpha, \beta) = \frac{\left(\frac{x}{\alpha}\right)^{\beta}}{1 + \left(\frac{x}{\alpha}\right)^{\beta}}$$

생존함수 #

생존함수 $S(x)$는 다음과 같습니다:

$$S(x; \alpha, \beta) = 1 - F(x; \alpha, \beta) = \frac{1}{1 + \left(\frac{x}{\alpha}\right)^{\beta}}$$

위험률 함수 (Hazard Function) #

위험률 함수 $h(x)$는:

$$h(x; \alpha, \beta) = \frac{f(x)}{S(x)} = \frac{\beta}{\alpha} \left(\frac{x}{\alpha}\right)^{\beta-1} \frac{1}{1 + \left(\frac{x}{\alpha}\right)^{\beta}}$$

주요 특성 #

단조성: $\beta > 1$일 때 위험률이 단조증가하고, $\beta < 1$일 때 단조감소합니다.
유연성: 다양한 형태의 위험률 패턴을 모델링할 수 있습니다.
해석 가능성: 모수들이 직관적인 의미를 가집니다.

모멘트 #

평균: $E[X] = \alpha \cdot B(1 + \frac{1}{\beta}, 1 - \frac{1}{\beta})$ (단, $\beta > 1$)
분산: 복잡한 형태로 베타 함수를 포함합니다.

여기서 $B(\cdot, \cdot)$는 베타 함수입니다.

응용 분야 #

1. 생존 분석 #

의학 연구에서 환자의 생존 시간 모델링
치료 효과 분석
재발 시간 예측

2. 신뢰성 공학 #

제품의 수명 분석
고장률 모델링
유지보수 계획 수립

3. 경제학 #

실업 기간 분석
기업 생존 분석
시장 진입/퇴출 모델링

4. 환경 과학 #

오염물질 분해 시간 모델링
생태계 복원 시간 분석

R에서의 구현 #

# 로그로그베타 분포 관련 함수들
library(actuar)

# 확률밀도함수
dloglogistic <- function(x, shape, scale) {
  (shape/scale) * (x/scale)^(shape-1) / (1 + (x/scale)^shape)^2
}

# 누적분포함수
ploglogistic <- function(x, shape, scale) {
  (x/scale)^shape / (1 + (x/scale)^shape)
}

# 분위수 함수
qloglogistic <- function(p, shape, scale) {
  scale * (p/(1-p))^(1/shape)
}

# 난수 생성
rloglogistic <- function(n, shape, scale) {
  u <- runif(n)
  qloglogistic(u, shape, scale)
}

Python에서의 구현 #

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

class LogLogisticBeta:
    def __init__(self, alpha, beta):
        self.alpha = alpha  # 척도 모수
        self.beta = beta    # 형태 모수
    
    def pdf(self, x):
        """확률밀도함수"""
        return (self.beta/self.alpha) * (x/self.alpha)**(self.beta-1) / \
               (1 + (x/self.alpha)**self.beta)**2
    
    def cdf(self, x):
        """누적분포함수"""
        return (x/self.alpha)**self.beta / (1 + (x/self.alpha)**self.beta)
    
    def survival(self, x):
        """생존함수"""
        return 1 / (1 + (x/self.alpha)**self.beta)
    
    def hazard(self, x):
        """위험률 함수"""
        return self.pdf(x) / self.survival(x)

모수 추정 #

최대우도추정법 (MLE) #

로그우도함수를 최대화하여 모수를 추정합니다:

$$\ell(\alpha, \beta) = n\log\beta - n\beta\log\alpha + (\beta-1)\sum_{i=1}^n \log x_i - 2\sum_{i=1}^n \log\left(1 + \left(\frac{x_i}{\alpha}\right)^{\beta}\right)$$

모멘트 방법 #

표본 모멘트와 이론적 모멘트를 일치시켜 모수를 추정합니다.

다른 분포와의 관계 #

로지스틱 분포: 특별한 경우로 연결됩니다.
와이불 분포: 경쟁 위험 모델에서 함께 사용됩니다.
지수 분포: $\beta = 1$일 때 특별한 형태를 가집니다.

장단점 #

장점 #

유연한 위험률 패턴 모델링 가능
해석하기 쉬운 모수
닫힌 형태의 생존함수

단점 #

복잡한 모멘트 계산
일부 경우에서 수치적 불안정성
제한된 형태의 위험률 패턴

참고문헌 #

Lawless, J.F. (2003). Statistical Models and Methods for Lifetime Data. Wiley.
Klein, J.P. & Moeschberger, M.L. (2003). Survival Analysis: Techniques for Censored and Truncated Data. Springer.
Collett, D. (2015). Modelling Survival Data in Medical Research. CRC Press.