728x90

카이제곱검정 3

[통계분석] 예제로 풀어보는 교차분석(카이제곱검정)

교차분석(카이제곱검정)2개 이상의 범주형 변수 간의 관계를 분석할 때 사용각 범주에 따른 종속변수의 분포를 분석할 때 사용 적합성 검정titanic 데이터에서 성별에 대한 분할표를 생성하고 아래의 가설에 대한 적합도 검정을 수행하여라. (유의수준 = 0.05) 귀무가설 : 타이타닉호의 생존자 중 남자와 여자의 비율은 차이가 없다.대립가설 : 타이타닉호의 생존자 중 남자와 여자의 비율은 차이가 있다. 1. 검정통계량 값 및 p-value(유의확률) 계산df_t = df[df['Survived']==1] # 생존자 데이터table = df_t['Sex'].value_counts() # 성별에 대한 분할표from scipy.stats import chisquarechisquare(table, f_exp=[17..

ADP/통계분석 2024.10.11

[통계분석] 교차분석(카이제곱검정) - 독립성 검정

교차분석(카이제곱검정)이란?2개 이상의 범주형 변수 간의 관계를 분석할 때 사용각 범주에 따른 종속변수의 분포를 분석할 때 사용독립변수 X : 범주형 변수종속변수 y : 범주형 변수 독립성 검정두 범주형 변수가 서로 독립적인지(연관이 없는지) 검정 1. 가설수립귀무가설 : 두 변수는 서로 독립적이다(연관이 없다).대립가설 : 두 변수는 서로 독립적이지 않다(연관이 있다). 2. 유의수준 설정 (0.05) 3. 검정통계량 값 및 유의확률(p-value) 계산1. 데이터가 주어진 경우from scipy.stats import chi2_contingencytable = pd.crosstab(X1, X2)chi2_contingency(table) 2. 데이터가 주어지지 않은 경우2-1. 검정통계량 $\chi^2..

ADP/통계분석 2024.10.10

[통계분석] 교차분석(카이제곱검정) - 적합성 검정

교차분석(카이제곱검정)이란?2개 이상의 범주형 변수 간의 관계를 분석할 때 사용각 범주에 따른 종속변수의 분포를 분석할 때 사용독립변수 X : 범주형 변수종속변수 y : 범주형 변수 적합성 검정각 범주에 따른 데이터의 관측빈도가 기대빈도를 따르는지 검정 1. 가설수립귀무가설 : 관측빈도와 기대빈도는 차이가 없다.대립가설 : 관측빈도와 기대빈도는 차이가 있다. 2. 유의수준 설정 (0.05)3. 검정통계량 값 및 유의확률(p-value) 계산1. 데이터가 주어진 경우from scipy.stats import chisquarechisquare(관측빈도, 기대빈도) # 관측빈도는 범주.value_counts() 결과 값을 입력, 관측빈도와 기대빈도는 array 형태로 입력해야 함 2. 데이터가 주어지지 않은 ..

ADP/통계분석 2024.10.10
728x90