R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 36일차

Chipmunks 2018. 6. 21.
728x90

공부 페이지

223 페이지 ~ 231 페이지


배운 개념

결정계수 (Coefficient of determination)

로 표현하는 결정계수는 전체 분산의 크기 중 모형이 설명하는 부분의 양을 비율로 계산한 것이다.

1에 가까울수록 모형이 설명하는 비중이 크니까 더 좋다고 할 수 있다.
결정계수 는 실제로 아빠 키와 아들 키의 상관계수 0.5를 제곱하면 결정계수와 동일한 값이 나온다.


단순선형회귀(Simple linear regression)

: 연속형 관심 변수 y를 하나의 연속형 설명 변수 x와의 직선 관계로 설명하는 아주 간단한 선형회귀모형

회귀분석(Regression analysis)

많은 설명 변수 중에서 진짜 모형에 필요한 의미 있는 변수를 찾기 위해 t-검정을 사용한다.
전체 모형이 관심 변수를 설명하는 양으로 F-검정을 활용해 모형이 쓸모 있는지 없는지를 판단한다.

이렇게 필요한 변수를 선택하고 모형의 효율을 따져 가며 회귀모형을 만드는 과정을 회귀분석이라고 한다.


다음 시간에 배울 것

데이터 분석 도구, R



댓글