R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 27일차

Chipmunks 2018. 6. 12.
728x90



공부 페이지

190 페이지 ~ 191 페이지


배운 개념

카이제곱통계량

앞서 t-분포를 활용한 유의성 검정을 하기 위해서 데이터에서 무엇을 계산했는가? 바로 t-값이라는 통계량이다.


교차표의 차이에 대한 유의성 검정을 위해서도 특별한 통계량을 계산해야 한다. 즉, 교차표에 있는 12개 숫자를 활용해 차이를 의미하는 하나의 숫자를 만들어내야 한다.


일단 부호의 문제도 없앨 겸 분산을 구할 때처럼 이 차이들을 제곱을 한다.



그 다음 분산처럼 제곱된 값을 바로 합하는 것이 아니라 중간 과정이 필요하다. 제곱의 결과를 독립 상황을 가정했을 때의 예상값으로 나눠준다.


아테네 금메달의 경우 실제 메달 수는 9개, 예상 매달수는 12개이므로 차이는 -3이고 제곱하면 9이다. 다시 예상 매달 수 12로 나눠 0.75가 계산된다.



이제 12개의 값을 모두 더한다.


이렇게 계산된 차이 정도의 합계 5.78을 카이제곱통계량(Chi-squared statistic) 혹은 카이제곱값(Chi-squared value)이라고 한다.


문자로는 다음과 같다.



다음 시간에 배울 것

카이제곱분포

댓글