728x90
공부 페이지
292 페이지 ~ 293 페이지
배운 개념
연봉 데이터 분위수 찾기
다섯 숫자 요악 중, 최솟값, 최댓값, 중앙값 3개의 값은 확인했다. 25%와 75%에 해당하는 Q1과 Q3값을 계산해보자
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | > Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8') [1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > quantile(salary, 0.9) 90% 6637 > quantile(salary, 0.25) 25% 1194.75 > quantile(salary, 0.75) 75% 4221.25 | cs |
summary() 함수로 요약하기
일일이 계산할 필요 없이 summary() 함수 안에 변수를 넣어 주기만 하면 자동으로 다섯 숫자가 계산이 된다.
1 2 3 | > summary(salary) Min. 1st Qu. Median Mean 3rd Qu. Max. 0 1195 2276 3140 4221 86669 | cs |
합계, 평균, 분산, 표준편차 계산하기
개념은 복잡하지만 계산 자체는 R로 쉽게할 수 있다.
1 2 3 4 5 6 7 8 9 10 11 | > sum(salary) [1] 31404486 > mean(salary) [1] 3140.449 > var(salary) [1] 10782551 > sd(salary) [1] 3283.68 | cs |
다음 시간에 배울 것
조건, 상자그림 출력하기
'R > R 프로젝트' 카테고리의 다른 글
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 54일차 (0) | 2018.07.09 |
---|---|
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 53일차 (0) | 2018.07.08 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 51일차 (0) | 2018.07.06 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 50일차 (0) | 2018.07.05 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 49일차 (0) | 2018.07.04 |
댓글