ADP/통계분석

[통계분석] Z-검정 (두 비율의 검정)

rtw0202 2024. 10. 10. 21:24
728x90

Z-검정이란?

모집단의 평균 또는 비율에 대한 가설을 검정할 때 사용

모집단의 표준편차를 알고 있거나, 표본 크기가 충분히 클 때(일반적으로 30 이상) 사용할 수 있는 검정 방법

 

두 비율의 검정

두 독립된 집단의 비율 차이가 통계적으로 유의미한지 검정하는 방법

 

1. 가설수립

귀무가설 : 두 집단 간 비율의 차이는 없다.

대립가설 : 두 집단 간 비율의 차이는 있다.

 

2. 유의수준 설정 (0.05)

 

3. 검정통계량 값 및 유의확률(p-value) 계산

1-1. 검정통계량 $z$ 계산

$$z = \frac{\hat{p_1} - \hat{p_2}}{\sqrt{p(1 - p) \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}}$$

$$\hat{p_1}: 첫 번째 표본의 비율$$
$$\hat{p_2}: 두 번째 표본의 비율$$
$$n_1: 첫 번째 표본의 크기$$
$$n_2 : 두 번째 표본의 크기$$
$$p: 두 표본의 전체 비율$$


$$p = \frac{x_1 + x_2}{n_1 + n_2}$$

$$x_1 : 첫 번째 표본에서 관측된 경우의 수$$
$$x_2 : 두 번째 표본에서 관측된 경우의 수$$

1-2. p-value 계산

p_value = 2 * (1 - stats.norm.cdf(np.abs(z))) # z-값을 기반으로 p-값 계산 (양측 검정)


=> p-value가 유의수준(0.05)보다 작으면 ‘두 집단 간 비율의 차이는 있다’라는 대립가설 채택

=> p-value가 유의수준(0.05)보다 크면 ‘두 집단 간 비율의 차이는 없다’라는 귀무가설 채택

728x90