R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 54일차

Chipmunks 2018. 7. 9.

728x90

공부 페이지

298 페이지 ~ 299 페이지

배운 개념

히스토그램으로 연봉 데이터 표시하기

> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')
[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C"
 
> setwd("~/Documents/Workspace/R/Practice/data")
 
> data = read.csv('salary_data.csv')
 
> salary = data$salary
 
> salary_10000 = salary[salary < 10000 ]
 
> hist(salary)

Colored by Color Scripter

1억 미만의 연봉 데이터 출력 하기

1
> hist(salary_10000, breaks=seq(0, 10000, 500))
cs

"breaks=" 옵션에 seq() 함수로 연봉 금액대를 좀 더 잘게 나눠 500만원 단위로 구간을 설정한다.

연보 구간이 높아질 수록 막대의 높이가 낮아진다.

눈 여겨볼 점은 0~500만원 구간이 500~1,000만원대보다 높다는 것을 알 수 있다. 앞선 포스팅에서 설명했듯이 중도 입사자, 중도 퇴사자의 영향으로 보인다.

하나의 연속형 변수는 상자그림과 히스토그램으로 특징을 살펴볼 수 있다.

다음 시간에 배울 것

하나의 범주형 변수 요약하기

저작자표시

'R > R 프로젝트' 카테고리의 다른 글

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 56일차 (0)	2018.07.11
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 55일차 (0)	2018.07.10
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 53일차 (0)	2018.07.08
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 52일차 (0)	2018.07.07
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 51일차 (0)	2018.07.06