728x90
비율의 신뢰구간
주어진 표본에서 비율을 기반으로 모집단 비율을 추정하는 방법
1. 표본 비율 계산
표본에서 성공의 수와 전체 표본 크기를 이용하여 표본 비율을 계산
$$\hat{p_1} = \frac{x_1}{n_1}$$
$$x_1: 표본 1의 성공의 수$$
$$n_1: 표본 1의 크기$$
$$\hat{p_2} = \frac{x_2}{n_2}$$
$$x_2: 표본 2의 성공의 수$$
$$n_2: 표본 2의 크기$$
2. 비율 차이 계산
$$\hat{p_1}-\hat{p_2}$$
3. 표준오차 계산
$$SE = \sqrt{ \frac{\hat{p_1} (1 - \hat{p_1})}{n_1} + \frac{\hat{p_2} (1 - \hat{p_2})}{n_2} }$$
4. 임계값 찾기
선택한 신뢰수준에 따라 z-score에서 z-임계값을 찾음
z_critical = stats.norm.ppf(1 - alpha / 2)
$$(\hat{p_1} - \hat{p_2}) \pm z_{\frac{\alpha}{2}} \cdot \sqrt{ \frac{\hat{p_1}(1 - \hat{p_1})}{n_1} + \frac{\hat{p_2}(1 - \hat{p_2})}{n_2} }$$
$$\hat{p_1} : 첫 번째 비율 (성공한 경우의 수 / 총 표본 수)$$
$$\hat{p_2} : 두 번째 비율 (성공한 경우의 수 / 총 표본 수)$$
$$z_{\alpha/2}: z 임계값$$
$$n_1 : 첫 번째 표본의 크기$$
$$n_2 : 두 번째 표본의 크기$$
728x90
'ADP > 통계분석' 카테고리의 다른 글
[통계분석] 이항분포 (1) | 2024.10.11 |
---|---|
[통계분석] 표본 크기 계산 (0) | 2024.10.11 |
[통계분석] 신뢰구간 - 모비율의 신뢰구간 (0) | 2024.10.10 |
[통계분석] 신뢰구간 - 모분산의 신뢰구간 (1) | 2024.10.10 |
[통계분석] 신뢰구간 - 모평균의 신뢰구간 (0) | 2024.10.10 |