ADP/통계분석

[통계분석] 신뢰구간 - 모평균의 신뢰구간

rtw0202 2024. 10. 10. 21:58
728x90

모평균의 신뢰구간

모집단의 평균이 포함될 가능성이 높은 범위를 추정하는 통계적 방법

 

1. 신뢰수준 설정 (90%, 95%, 99%)

 

2. 표본 평균 계산

신뢰구간의 중심값이 됨

 

3. 모집단 표준편차 또는 표본 표준편차 결정

1. 모집단의 표준편차를 알고 있는 경우 $\sigma$를 사용

2. 모집단의 표준편차를 모르는 경우 $s$(표본의 표준편차)를 사용

 

4. 표준오차 결정

1. 모집단 표준편차 $\sigma$가 주어질 때

$$SE = \frac{\sigma}{\sqrt{n}}$$
$$\sigma : 모표준편차$$
$$n : 표본 크기$$

2. 표본 표준편차 $s$가 주어질 때 (모집단 표준편차 $\sigma$가 주어지지 않을 때)

$$SE = \frac{s}{\sqrt{n}}$$
$$s : 표본 표준편차$$
$$n : 표본 크기$$

 

5. 임계값 찾기

선택한 신뢰수준에 따라 z-임계값(정규분포) 또는 t-임계값(표본의 표준편차를 사용할 경우)을 찾음

1. 모집단 표준편차 $\sigma$가 주어질 때 (z-score 사용)

z_critical = norm.ppf(1 - alpha/2)

$$\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$$
$$\bar{x}: 표본 평균$$
$$z_{\alpha/2}: z 임계값$$
$$\sigma: 모집단 표준편차$$
$$n: 표본 크기$$

 

2. 표본 표준편차 $s$가 주어질 때 (모집단 표준편차 $\sigma$가 주어지지 않을 때, t-분포 사용)

t_critical = stats.t.ppf(1-alpha/2, df)

$$\bar{x} \pm t \frac{s}{\sqrt{n}}$$
$$\bar{x}: 표본 평균$$
$$t: t 임계값$$
$$s: 표본 표준편차$$
$$n: 표본 크기$$

728x90