728x90
공부 페이지
298 페이지 ~ 299 페이지
배운 개념
히스토그램으로 연봉 데이터 표시하기
1 2 3 4 5 6 7 8 9 10 11 12 | > Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8') [1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > salary_10000 = salary[salary < 10000 ] > hist(salary) | cs |
1억 미만의 연봉 데이터 출력 하기
1 | > hist(salary_10000, breaks=seq(0, 10000, 500)) | cs |
"breaks=" 옵션에 seq() 함수로 연봉 금액대를 좀 더 잘게 나눠 500만원 단위로 구간을 설정한다.
연보 구간이 높아질 수록 막대의 높이가 낮아진다.
눈 여겨볼 점은 0~500만원 구간이 500~1,000만원대보다 높다는 것을 알 수 있다. 앞선 포스팅에서 설명했듯이 중도 입사자, 중도 퇴사자의 영향으로 보인다.
하나의 연속형 변수는 상자그림과 히스토그램으로 특징을 살펴볼 수 있다.
다음 시간에 배울 것
하나의 범주형 변수 요약하기
'R > R 프로젝트' 카테고리의 다른 글
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 56일차 (0) | 2018.07.11 |
---|---|
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 55일차 (0) | 2018.07.10 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 53일차 (0) | 2018.07.08 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 52일차 (0) | 2018.07.07 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 51일차 (0) | 2018.07.06 |
댓글