R/R 프로젝트101 [ 이토록 쉬운 통계&R 100일 프로젝트 ] 64일차 공부 페이지311 페이지 배운 개념히트맵(열지도) 그리기123> par(family="AppleGothic") > heatmap(t_DSBJT_SEX, col=colorRampPalette(c('white', 'dodgerblue'))(100), scale='none', Rowv=NA, Colv=NA, cexRow=1, cexCol=2)cs 전체 숫자로 열지도를 그리다보니, 진료건수가 작은 재활의학과, 영상의학과 같은 경우에는 아예 없는 것처럼 나온다. 반면, 진료건수가 월등히 높은 내과 같은 경우에는 진하게 표시된다. 이를 절대적 숫자로 그리지 말고, 백분율로 그리면 해결이 된다. 다음 시간에 배울 것교차표 대신 행백분율 열지도 그리기 R/R 프로젝트 2018. 7. 19. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 63일차 공부 페이지310 페이지 배운 개념DSBJT와 SEX의 교차표12345678910111213141516171819202122232425> t_DSBJT_SEX = table(treat$DSBJT, treat$SEX) > t_DSBJT_SEX 1_남 2_여 가정의학과 23084 30858 내과 301448 375998 마취통증의학과 9959 14310 방사선종양학과 1456 2497 비뇨기과 31288 18622 산부인과 948 84793 성형외과 2305 1872 소아청소년과 57119 57195 신경과 11513 16922 신경외과 12478 16828 안과 54417 78565 영상의학과 943 1622 외과 26576 36104 응급의학과 7992 8826 이비인후과 91732 114036 재활의학.. R/R 프로젝트 2018. 7. 18. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 62일차 공부 페이지309 페이지 배운 개념열 백분율 보기123456789101112131415161718192021> round(prop.table(t_AGE_SEX, 2), 2) 1_남 2_여 01_0-4세 0.10 0.07 02_5-9세 0.06 0.04 03_10-14세 0.03 0.02 04_15-19세 0.04 0.03 05_20-24세 0.03 0.03 06_25-29세 0.04 0.05 07_30-34세 0.05 0.07 08_35-39세 0.05 0.06 09_40-44세 0.06 0.06 10_45-49세 0.06 0.06 11_50-54세 0.07 0.08 12_55-59세 0.08 0.10 13_60-64세 0.08 0.08 14_65-69세 0.08 0.08 15_70-74세 0.08 0... R/R 프로젝트 2018. 7. 17. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 61일차 공부 페이지308 페이지 배운 개념prop.table() 사용하기1234567891011121314151617181920212223> t_AGE_SEX = table(treat$AGE, treat$SEX) > round(prop.table(t_AGE_SEX, 1), 2) 1_남 2_여 01_0-4세 0.52 0.48 02_5-9세 0.53 0.47 03_10-14세 0.52 0.48 04_15-19세 0.52 0.48 05_20-24세 0.40 0.60 06_25-29세 0.36 0.64 07_30-34세 0.34 0.66 08_35-39세 0.38 0.62 09_40-44세 0.42 0.58 10_45-49세 0.41 0.59 11_50-54세 0.39 0.61 12_55-59세 0.38 0.62 13.. R/R 프로젝트 2018. 7. 15. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 60일차 공부 페이지607 페이지 배운 개념교차표 상대적인 숫자 살펴보기prop.table() 함수를 사용한다. 콤마 뒤에 1을 넣으면 행 백분율을, 2를 넣으면 열 백분율을 계산해준다. 다음 시간에 배울 것R 실습 R/R 프로젝트 2018. 7. 15. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 59일차 공부 페이지306 페이지 배운 개념table() 함수로 두 범주형 변수 교차표 출력하기123456789101112131415161718192021> table(treat$AGE, treat$SEX) 1_남 2_여 01_0-4세 84391 77220 02_5-9세 52402 46407 03_10-14세 29765 27431 04_15-19세 31413 29411 05_20-24세 24710 36752 06_25-29세 30705 54537 07_30-34세 38341 75842 08_35-39세 42272 68918 09_40-44세 49677 68486 10_45-49세 52625 75166 11_50-54세 62114 95169 12_55-59세 70529 113771 13_60-64세 68529 98.. R/R 프로젝트 2018. 7. 14. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 58일차 공부 페이지305 페이지 배운 개념두 개의 범주형 변수의 관계 찾기변수가 2개나 되는 순간, 분석의 목적은 명확하다. 두 변수 사이에 어떤 관계가 있는지 살펴보는 것이다. 두 변수의 조합별로 몇 개의 관측치가 있는지 개수를 셀 수 있다. 다음 시간에 배울 것table() 함수 R/R 프로젝트 2018. 7. 12. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 57일차 공부 페이지304 페이지 ~ 305 페이지 배운 개념AGE 변수 활용한 막대그래프12par(family="AppleGothic")barplot(round(table(treat$AGE) / 1000), las=2)cs "las=2" 옵션은 X축 글자를 90도 회전 시킨다.par() 함수는 그래프에 한글 폰트를 추가해주기 위함이다. 5세 미만 아기들의 진료 건수가 많다. 튼튼한 청소년기로 접어들며 진료 건수가 줄어들고 20대 후반부터 점점 진료건수가 늘어난다. 70세 이상부터 진료건수가 급격히 줄어드는 것은 병원에 가는 횟수가 줄었다기 보다는 해당 인구가 줄었다고 보는 편이 합리적인 것 같다. 이 그림을 파이 차트에 그리면 다음과 같다. 1pie(round(table(treat$AGE) / 1000))cs .. R/R 프로젝트 2018. 7. 12. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 56일차 공부 페이지301 페이지 ~ 303 페이지 배운 개념하나의 범주형 변수를 요약하기 : 병원을 가장 자주 찾는 사람은 누굴까?12345678910111213141516> treat$MONTH = factor(treat$MONTH) > treat$SEX = factor(treat$SEX) > levels(treat$SEX)[1] "1" "2" > levels(treat$SEX) = c("1_남", "2_여") > str(treat)'data.frame': 2016783 obs. of 5 variables: $ MONTH : Factor w/ 12 levels "1","2","3","4",..: 12 12 12 12 12 12 12 12 12 12 ... $ AGE : Factor w/ 18 levels "0.. R/R 프로젝트 2018. 7. 11. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 55일차 공부 페이지300 페이지 ~ 301 페이지 배운 개념하나의 범주형 변수를 요약하기 : 병원을 가장 자주 찾는 사람은 누굴까?공공데이타포털에서 각 정부부처에서 공개한 데이터들을 열람할 수 있다. 그 중 건강보험공단에서 공개한 100만 건의 진료내역 정보를 살펴보자. 원본 데이터는 2015년에 있었던 약 100만 건의 진료 내역을 담고 있다. 여기서 사용할 데이터는 서울의 외래 진료내역인 약 200만 건의 데이터다. 1234567891011121314> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data".. R/R 프로젝트 2018. 7. 10. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 54일차 공부 페이지298 페이지 ~ 299 페이지 배운 개념히스토그램으로 연봉 데이터 표시하기123456789101112> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > salary_10000 = salary[salary hist(salary)Colored by Color Scriptercs 1억 미만의 연봉 데이터 출력 하기1> hist(salary_10000, breaks=seq(0, 1.. R/R 프로젝트 2018. 7. 9. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 53일차 공부 페이지294 페이지 ~ 297 페이지 배운 개념부등호 논리연산으로 정보 찾기희망 연봉이 4,000만원이라면, 이 회사에 있는 10,000명 중 상위 몇 %나 될지 궁금할 때는, 부등호를 사용해 논리연산을 하면 된다. 123456789101112131415161718> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > salary > 4000 [1] FALSE TRUE FALSE FA.. R/R 프로젝트 2018. 7. 8. 이전 1 2 3 4 5 6 7 ··· 9 다음