ADP/통계분석

[통계분석] 신뢰구간 - 비율의 신뢰구간

rtw0202 2024. 10. 11. 09:29
728x90

비율의 신뢰구간

주어진 표본에서 비율을 기반으로 모집단 비율을 추정하는 방법

 

1. 표본 비율 계산

표본에서 성공의 수와 전체 표본 크기를 이용하여 표본 비율을 계산

$$\hat{p_1} = \frac{x_1}{n_1}$$
$$x_1: 표본 1의 성공의 수$$
$$n_1: 표본 1의 크기$$

$$\hat{p_2} = \frac{x_2}{n_2}$$
$$x_2: 표본 2의 성공의 수$$
$$n_2: 표본 2의 크기$$

 

2. 비율 차이 계산

$$\hat{p_1}-\hat{p_2}$$

 

3. 표준오차 계산

$$SE = \sqrt{ \frac{\hat{p_1} (1 - \hat{p_1})}{n_1} + \frac{\hat{p_2} (1 - \hat{p_2})}{n_2} }$$

 

4. 임계값 찾기

선택한 신뢰수준에 따라 z-score에서 z-임계값을 찾음

z_critical = stats.norm.ppf(1 - alpha / 2)

$$(\hat{p_1} - \hat{p_2}) \pm z_{\frac{\alpha}{2}} \cdot \sqrt{ \frac{\hat{p_1}(1 - \hat{p_1})}{n_1} + \frac{\hat{p_2}(1 - \hat{p_2})}{n_2} }$$
$$\hat{p_1} : 첫 번째 비율 (성공한 경우의 수 / 총 표본 수)$$
$$\hat{p_2} : 두 번째 비율 (성공한 경우의 수 / 총 표본 수)$$
$$z_{\alpha/2}: z 임계값$$
$$n_1 : 첫 번째 표본의 크기$$
$$n_2 : 두 번째 표본의 크기$$

728x90