R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 78일차

Chipmunks 2018. 8. 2.
728x90



공부 페이지

322 페이지 ~ 323 페이지


배운 개념

산점도 그리기

1
> plot(heights, pch=16, col=rgb(0.20.20.20.5))
cs



두 개의 상자그림으로는 두 변수의 관계를 알아낼 수 있다. 관계를 알아내기 위해서는 요약하기 전의 값을 살펴봐야 한다. 두 변수의 값을 그대로 좌표로 활용한 산점도를 그려보자.


첫 번째 변수 father를 가로축(x축) 좌표로, 두 번째 변수 son을 세로축(y축) 좌표로 활용해서 2차원 공간에 점을 찍는다.


관측치의 개수인 1,078개의 점이 찍히고, 이 점이 만들어내는 패턴으로 두 변수의 관계를 찾아보자.


pch= 옵션으로 점 모양을 바꾸고, col= 옵션과 rgb() 함수를 활요해 불투명한 회색으로 표현했다.


보조선 추가하기


좀 더 효과적인 표현을 위해 가로축에서 아빠의 평균 키에 수직선을 그리고, 세로축에서 아들의 평균 키에 수평을 추가해보자.


보조선을 추가하기 위해서는 abline() 함수를 사용해야 한다. v= 옵션으로 수직선, h= 옵션으로 수평선을 추가할 수 있다. lty=2 옵션으로 선 종류를 점선으로 바꿀 수 있다.


1
2
3
> abline(v=mean(heights$father), lty=2)
 
> abline(h=mean(heights$son), lty=2)
cs



아빠의 평균 키와 아들의 평균 키에 그은 2개의 보조선은 2차원 평면을 4등분 해준다. 오른쪽 위에서부터 반시계 방향으로 제1사분면, 제2사분면, 제3사분면, 제4사분면이라고 부른다.


다음 시간에 배울 것

사분면 해석



댓글