728x90
이항분포란?
두 가지 가능한 결과(성공 또는 실패)만을 갖는 실험을 여러 번 반복할 때 사용되는 확률 분포
각 실험은 독립적이며, 성공의 확률이 일정하게 유지되는 경우에 적용
확률 질량 함수(PMF)
$$P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}$$
$$P(X = k) : k번의 성공 확률$$
$$n : 시행 횟수$$
$$k : 성공한 횟수$$
$$p : 성공 확률$$
$$\binom{n}{k} : 조합 (nCk)으로, n개 중 k개를 선택하는 방법의 수$$
stats.binom.pmf(k, n, p) # 정확히 k개의 성공이 발생할 확률을 구할 때 사용
누적 분포 함수(CDF)
$$P(X \leq k) = \sum_{i=0}^{k} P(X = i) = \sum_{i=0}^{k} \binom{n}{i} p^i (1 - p)^{n - i}$$
$$P(X \leq k): k회 이하의 성공 확률$$
$$n : 시행 횟수$$
$$k : 성공한 횟수$$
$$p : 성공 확률$$
$$\binom{n}{i} : 조합 (nCi)으로, n개 중 i개를 선택하는 방법의 수$$
stats.binom.cdf(k, n, p) # k회 이하의 성공이 발생할 누적 확률을 구할 때 사용
기대값 및 분산
기대값
$$E(X) = n \cdot p$$
분산
$$Var(X) = n \cdot p \cdot (1 - p)$$
728x90
'ADP > 통계분석' 카테고리의 다른 글
[통계분석] 예제로 풀어보는 분산분석(ANOVA) - 일원배치 분산분석 (0) | 2024.10.11 |
---|---|
[통계분석] 예제로 풀어보는 t-검정 (4) | 2024.10.11 |
[통계분석] 표본 크기 계산 (0) | 2024.10.11 |
[통계분석] 신뢰구간 - 비율의 신뢰구간 (0) | 2024.10.11 |
[통계분석] 신뢰구간 - 모비율의 신뢰구간 (0) | 2024.10.10 |