R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 54일차

Chipmunks 2018. 7. 9.
728x90



공부 페이지

298 페이지 ~ 299 페이지


배운 개념

히스토그램으로 연봉 데이터 표시하기

1
2
3
4
5
6
7
8
9
10
11
12
> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')
[1"ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C"
 
> setwd("~/Documents/Workspace/R/Practice/data")
 
> data = read.csv('salary_data.csv')
 
> salary = data$salary
 
> salary_10000 = salary[salary < 10000 ]
 
> hist(salary)
cs



1억 미만의 연봉 데이터 출력 하기

1
> hist(salary_10000, breaks=seq(010000500))
cs


"breaks=" 옵션에 seq() 함수로 연봉 금액대를 좀 더 잘게 나눠 500만원 단위로 구간을 설정한다.


연보 구간이 높아질 수록 막대의 높이가 낮아진다.


눈 여겨볼 점은 0~500만원 구간이 500~1,000만원대보다 높다는 것을 알 수 있다. 앞선 포스팅에서 설명했듯이 중도 입사자, 중도 퇴사자의 영향으로 보인다.


하나의 연속형 변수는 상자그림과 히스토그램으로 특징을 살펴볼 수 있다.



다음 시간에 배울 것

하나의 범주형 변수 요약하기



댓글