공부 페이지
202 페이지 ~ 206 페이지
배운 개념
F-검정
그룹이나 조건에 따른 차이를 검정하는 편리한 수단.
F-값은 범주형 변수, 즉 '그룹에 따라 연속형 변수에 얼마나 큰 차이가 있는지' 혹은 '범주형 변수가 연속형 변수의 차이를 얼마나 많이 설명하는지' 를 말한다.
이 F-값이 얼마나 큰 값인지는 F-분포 속에서 상대적인 위치를 측장한 p-값으로 계산한다.
학생 번호 |
점수() |
공부 방법() |
전체 평균() |
그룹 평균() |
1 |
0 |
A |
5 |
1 |
2 |
2 |
A |
5 |
1 |
3 |
4 |
B |
5 |
5 |
4 |
6 |
B |
5 |
5 |
5 |
8 |
C |
5 |
9 |
6 |
10 |
C |
5 |
9 |
세 번째, 의 제곱합은 그룹의 평균들이 전체의 평균과 얼마나 차이가 나는지를 의미한다. 그룹 간 평균 점수가 얼마나 차이가 나는지를 측정하고, 공부 방법에 따라 점수가 얼마나 다른지를 알려준다.
세 번째 제곱합이 크면 클수록 그룹에 따른 차이가 크다고 할 수 있다.
두 번째, 의 제곱합의 의미는 무엇일까? 같은 그룹에 있는 두 학생은 똑같은 방법으로 공부했지만 2점이라는 점수 차가 이썼다. 이 차이는 개개인의 환경, 성격 등 다양한 요인이 있을 수 있으므로 데이터만으로는 설명하는 데 한계가 있는 부분이다.
첫 번째 제곱합은 70, 두 번째는 6, 세 번째는 64다. 두 번째와 세 번째 제곱합을 더하면 정확히 첫 번째 제곱합과 같다.
수식으로 정리하면 다음과 같다.
관측치들의 전체적인 차이를 의미하는 분산은, 그룹의 차이로 설명할 수 있는 부분과 도저히 설명할 수 없는 개인차에 해당하는 나머지 부분으로 나뉜다는 점이 흥미롭다.
다음 시간에 배울 것
'R > R 프로젝트' 카테고리의 다른 글
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 33일차 (0) | 2018.06.19 |
---|---|
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 32일차 (0) | 2018.06.17 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 30일차 (0) | 2018.06.15 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 29일차 (0) | 2018.06.14 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 28일차 (0) | 2018.06.13 |
댓글