전체 글543 [ 이토록 쉬운 통계&R 100일 프로젝트 ] 55일차 공부 페이지300 페이지 ~ 301 페이지 배운 개념하나의 범주형 변수를 요약하기 : 병원을 가장 자주 찾는 사람은 누굴까?공공데이타포털에서 각 정부부처에서 공개한 데이터들을 열람할 수 있다. 그 중 건강보험공단에서 공개한 100만 건의 진료내역 정보를 살펴보자. 원본 데이터는 2015년에 있었던 약 100만 건의 진료 내역을 담고 있다. 여기서 사용할 데이터는 서울의 외래 진료내역인 약 200만 건의 데이터다. 1234567891011121314> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data".. R/R 프로젝트 2018. 7. 10. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 54일차 공부 페이지298 페이지 ~ 299 페이지 배운 개념히스토그램으로 연봉 데이터 표시하기123456789101112> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > salary_10000 = salary[salary hist(salary)Colored by Color Scriptercs 1억 미만의 연봉 데이터 출력 하기1> hist(salary_10000, breaks=seq(0, 1.. R/R 프로젝트 2018. 7. 9. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 53일차 공부 페이지294 페이지 ~ 297 페이지 배운 개념부등호 논리연산으로 정보 찾기희망 연봉이 4,000만원이라면, 이 회사에 있는 10,000명 중 상위 몇 %나 될지 궁금할 때는, 부등호를 사용해 논리연산을 하면 된다. 123456789101112131415161718> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > salary > 4000 [1] FALSE TRUE FALSE FA.. R/R 프로젝트 2018. 7. 8. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 52일차 공부 페이지292 페이지 ~ 293 페이지 배운 개념연봉 데이터 분위수 찾기다섯 숫자 요악 중, 최솟값, 최댓값, 중앙값 3개의 값은 확인했다. 25%와 75%에 해당하는 Q1과 Q3값을 계산해보자 1234567891011121314151617181920> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > salary = data$salary > quantile(salary, 0.9) 90% 6637 > quantile(sala.. R/R 프로젝트 2018. 7. 7. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 51일차 공부 페이지289 페이지 ~ 292 페이지 배운 개념하나의 연속형 변수를 요약하기123456789101112131415161718> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > data = read.csv('salary_data.csv') > head(data) salary1 29302 61223 33014 9795 49266 2328 > nrow(data)[1] 10000Colored by Color Scriptercs 데이터 예제는 dataartproject.xyz 에서 다운로드 받을.. R/R 프로젝트 2018. 7. 6. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 50일차 공부 페이지286 페이지 ~ 288 페이지 배운 개념install.packages() 함수로 패키지 설치하기12345678910> install.packages("ca")--- Please select a CRAN mirror for use in this session ---trying URL 'https://cloud.r-project.org/bin/macosx/el-capitan/contrib/3.4/ca_0.70.tgz'Content type 'application/x-gzip' length 119599 bytes (116 KB)==================================================downloaded 116 KB The downloaded binary packag.. R/R 프로젝트 2018. 7. 5. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 49일차 공부 페이지281 페이지 ~ OO 페이지 배운 개념[]와 논리연산으로 관측치 선택하기123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > subway = read.csv("subway.csv", fileEncoding = "euc-kr") > n.. R/R 프로젝트 2018. 7. 4. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 48일차 공부 페이지277 페이지 ~ 281 페이지 배운 개념$를 활용한 변수 수정과 추가하기123456789101112131415161718192021> setwd("~/Documents/Workspace/R/Practice/data") > demo = read.csv("gender_age.csv", fileEncoding = "euc-kr") > demo$Gender = factor(demo$Gender) > str(demo)'data.frame': 6 obs. of 2 variables: $ Gender: Factor w/ 2 levels "1","2": 1 2 1 2 1 2 $ Age : int 30 20 20 20 30 30 > paste0(demo$Gender, "_", demo$Age, "대")[1].. R/R 프로젝트 2018. 7. 3. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 47일차 공부 페이지275 페이지 ~ 276 페이지 배운 개념factor() 함수로 범주형 변수 만들기변수는 크게 연속형 변수와 범주형 변수로 나뉜다. 가끔 데이터를 만들 때 범주형 변수를 숫자로 입력할 때가 많다. 이를 카리켜 흔히 코딩(Coding)이라고 한다. 성별을 "남자", "여자"로 입력받기 보다, 1, 2, ... 처럼 순서대로 입력하면 데이터를 만들기도 편하고, 저장용량도 줄어든다. 코드집을 따로 만들어서 1은 "남자", 2는 "여자"를 의미하는 것을 알리기만 하면 된다. 이 방식에는 한 가지 문제가 있다. 1과 2로 구성된 변수 성별이 우리가 보기에는 범주형 변수지만, R이 보기에는 숫자일 뿐이다. read.csv()와 같은 함수는 외부 데이터를 불러와 인식할 때, 한 변수의 모든 관측치가 숫자면.. R/R 프로젝트 2018. 7. 2. 매쉬업 해커톤 후기 (2018.6.30 ~ 2018.7.1) 짧은 후기2018년 6월 30일 토요일 오후 3시부터, 2018년 7월 1일 일요일 오전 9시까지 길다면 길고 짧다면 짧은 해커톤을 마쳤다! 🏃♀️🏃♀️ 매쉬업 동아리는, IT 연합 동아리이다. 다양한 분야의 지식과 경험을 가진, 직장인과 학생 모두 모여 모바일 앱 서비스를 함께 만들어간다. 👨💻👩💻🍻 올해 3월 말, 나는 iOS 파트를 지원하여 3개월 간 재밌는 시간을 보냈다. 그리고 5월에 9월까지 이행할 프로젝트가 선정되었다. 그 프로젝트의 기본 토대를 다지기 위한, 이른 6월 말에 무박 2일의 해커톤을 진행했다. 각 프로젝트 팀에는 숙련자와 초보자들이 있다.숙련자에겐 빠르게 프로토타입을 만들어, 서비스에 어떤 결함이 있고 어떻게 보충해야할 지 생각해보는 기회가 된다.초보자에겐 개발 프로세스.. 자유/잡담 2018. 7. 1. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 46일차 공부 페이지273 페이지 ~ 274 페이지 배운 개념View() 함수로 스프레드시트 확인하기1> View(subway)cs $를 활용한 변수 선택하기12345> subway[, 4][1] 411 280 434 255 543 260 372 179 499 465 489 292 ... > subway$H5[1] 411 280 434 255 543 260 372 179 499 465 489 292 ...cs subway[, 4]는 데이터에서 4번째 변수를 가져온다. 이와 같이 대괄호 인덱스로 가져오는 방법이 있다. 그리고 변수 이름을 활용한 방법이 있다.데이터 이름 뒤에 $를 붙이고 바로 뒤에 변수 이름을 붙여 특정한 변수만 선택할 수 있다. 다음 시간에 배울 것factor().. R/R 프로젝트 2018. 7. 1. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 45일차 공부 페이지269 페이지 ~ 272 페이지 배운 개념데이터파일 다운로드링크 에서 다운로드 names() 함수 실습names() 함수를 쓰면 데이터에서 변수 이름만 떼어서 살펴볼 수 있다. 1234567891011> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > subway = read.csv("subway.csv", fileEncoding = "euc-kr") > names(subway) [1] "역명" "날짜" "구분" "X05.06시" "X06.07시" "X07.08시" "X08.09시.. R/R 프로젝트 2018. 6. 30. 이전 1 ··· 30 31 32 33 34 35 36 ··· 46 다음