R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 74일차

Chipmunks 2018. 7. 29.
728x90



공부 페이지

318 페이지 ~ 319 페이지


배운 개념

두 개의 연속형 변수의 관계 찾기

과연 아빠의 키는 아들 키에 얼마나 큰 영향을 줄까?


이전에 살펴본, 피어슨의 데이터를 불러와보자


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')
[1"ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C"
 
> setwd("~/Documents/Workspace/R/Practice/data")
 
> heights = read.csv('heights.csv', fileEncoding = "euc-kr")
 
> head(heights)
  father   son
1  165.2 151.8
2  160.7 160.6
3  165.0 160.9
4  167.0 159.5
5  155.3 163.3
6  160.1 163.2
 
> nrow(heights)
[11078
cs


데이터에 각각 아빠 키, 아들 키를 의미하는 두 개의 변수 father 와 son 이 있다.


첫 번째 관측치를 살펴보자면, 아빠 키가 165.2cm 이고 아들 키가 151.8cm 이다. 이런 식으로 1078개의 아버지와 아들 키 데이터가 정리되어 있다.


원본 데이터는 인치(inch)지만 한국인에게 친숙한 센티미터(cm)으로 변환했다.


다음 시간에 배울 것

각 변수의 특징 살펴보기



댓글