R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 31일차

Chipmunks 2018. 6. 16.
728x90



공부 페이지

202 페이지 ~ 206 페이지


배운 개념

F-검정

그룹이나 조건에 따른 차이를 검정하는 편리한 수단.


F-값은 범주형 변수, 즉 '그룹에 따라 연속형 변수에 얼마나 큰 차이가 있는지' 혹은 '범주형 변수가 연속형 변수의 차이를 얼마나 많이 설명하는지' 를 말한다.

이 F-값이 얼마나 큰 값인지는 F-분포 속에서 상대적인 위치를 측장한 p-값으로 계산한다.


학생 번호 

점수(

공부 방법()

전체 평균(

그룹 평균()

1

10 


세 가지 제곱합을 계산한다.

첫 번째, 의 제곱합은 (n-1)로 나누지만 않았지 사실상 분산과 같다. 관측치들이 서로 얼마나 다른지를 의미한다.

세 번째, 의 제곱합은 그룹의 평균들이 전체의 평균과 얼마나 차이가 나는지를 의미한다. 그룹 간 평균 점수가 얼마나 차이가 나는지를 측정하고, 공부 방법에 따라 점수가 얼마나 다른지를 알려준다.

세 번째 제곱합이 크면 클수록 그룹에 따른 차이가 크다고 할 수 있다.


두 번째, 의 제곱합의 의미는 무엇일까? 같은 그룹에 있는 두 학생은 똑같은 방법으로 공부했지만 2점이라는 점수 차가 이썼다. 이 차이는 개개인의 환경, 성격 등 다양한 요인이 있을 수 있으므로 데이터만으로는 설명하는 데 한계가 있는 부분이다.


첫 번째 제곱합은 70, 두 번째는 6, 세 번째는 64다. 두 번째와 세 번째 제곱합을 더하면 정확히 첫 번째 제곱합과 같다.


수식으로 정리하면 다음과 같다.



관측치들의 전체적인 차이를 의미하는 분산은, 그룹의 차이로 설명할 수 있는 부분과 도저히 설명할 수 없는 개인차에 해당하는 나머지 부분으로 나뉜다는 점이 흥미롭다.


다음 시간에 배울 것

F-값 계산



댓글