728x90
Z-검정이란?
모집단의 평균 또는 비율에 대한 가설을 검정할 때 사용
모집단의 표준편차를 알고 있거나, 표본 크기가 충분히 클 때(일반적으로 30 이상) 사용할 수 있는 검정 방법
두 비율의 검정
두 독립된 집단의 비율 차이가 통계적으로 유의미한지 검정하는 방법
1. 가설수립
귀무가설 : 두 집단 간 비율의 차이는 없다.
대립가설 : 두 집단 간 비율의 차이는 있다.
2. 유의수준 설정 (0.05)
3. 검정통계량 값 및 유의확률(p-value) 계산
1-1. 검정통계량 $z$ 계산
$$z = \frac{\hat{p_1} - \hat{p_2}}{\sqrt{p(1 - p) \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}}$$
$$\hat{p_1}: 첫 번째 표본의 비율$$
$$\hat{p_2}: 두 번째 표본의 비율$$
$$n_1: 첫 번째 표본의 크기$$
$$n_2 : 두 번째 표본의 크기$$
$$p: 두 표본의 전체 비율$$
$$p = \frac{x_1 + x_2}{n_1 + n_2}$$
$$x_1 : 첫 번째 표본에서 관측된 경우의 수$$
$$x_2 : 두 번째 표본에서 관측된 경우의 수$$
1-2. p-value 계산
p_value = 2 * (1 - stats.norm.cdf(np.abs(z))) # z-값을 기반으로 p-값 계산 (양측 검정)
=> p-value가 유의수준(0.05)보다 작으면 ‘두 집단 간 비율의 차이는 있다’라는 대립가설 채택
=> p-value가 유의수준(0.05)보다 크면 ‘두 집단 간 비율의 차이는 없다’라는 귀무가설 채택
728x90
'ADP > 통계분석' 카테고리의 다른 글
[통계분석] 신뢰구간 - 모평균의 신뢰구간 (0) | 2024.10.10 |
---|---|
[통계분석] 모집단의 분산 검정 (0) | 2024.10.10 |
[통계분석] Z-검정 (모집단의 평균 검정) (0) | 2024.10.10 |
[통계분석] 교차분석(카이제곱검정) - 독립성 검정 (0) | 2024.10.10 |
[통계분석] 교차분석(카이제곱검정) - 적합성 검정 (0) | 2024.10.10 |