ADP/통계분석

[통계분석] 이항분포

rtw0202 2024. 10. 11. 09:42
728x90

이항분포란?

두 가지 가능한 결과(성공 또는 실패)만을 갖는 실험을 여러 번 반복할 때 사용되는 확률 분포

각 실험은 독립적이며, 성공의 확률이 일정하게 유지되는 경우에 적용

 

확률 질량 함수(PMF)

$$P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}$$
$$P(X = k) : k번의 성공 확률$$
$$n : 시행 횟수$$
$$k : 성공한 횟수$$
$$p : 성공 확률$$
$$\binom{n}{k} : 조합 (nCk)으로, n개 중 k개를 선택하는 방법의 수$$

stats.binom.pmf(k, n, p) # 정확히 k개의 성공이 발생할 확률을 구할 때 사용

 

누적 분포 함수(CDF)

$$P(X \leq k) = \sum_{i=0}^{k} P(X = i) = \sum_{i=0}^{k} \binom{n}{i} p^i (1 - p)^{n - i}$$
$$P(X \leq k): k회 이하의 성공 확률$$
$$n : 시행 횟수$$
$$k : 성공한 횟수$$
$$p : 성공 확률$$
$$\binom{n}{i} : 조합 (nCi)으로, n개 중 i개를 선택하는 방법의 수$$

stats.binom.cdf(k, n, p) # k회 이하의 성공이 발생할 누적 확률을 구할 때 사용

 

기대값 및 분산

기대값

$$E(X) = n \cdot p$$

분산

$$Var(X) = n \cdot p \cdot (1 - p)$$

728x90