전체 보기529 [ 이토록 쉬운 통계&R 100일 프로젝트 ] 79일차 공부 페이지324 페이지 배운 개념사분면 해석 제1사분면은 아빠와 아들 모두 평균보다 키가 큰 가족이다. 그와 대각선 반대에 위치한 제3사분면은 아빠와 아들 모두 평균보다 키가 작은 가족이다. 이 두 집단은 완전히 달라 보이지만, '아들의 키는 아빠의 키에 영향을 받는다' 는 의미를 가지고 있다. 반면 제2, 4사분면의 점들은 아빠와 아들 중 한쪽은 평균보다 크지만 나머지 한쪽은 평균보다 작아서 제1, 3사분면과는 반대로 '아들의 키는 아빠의 키에 영향을 받지 않는다' 는 의미를 지니다. 눈으로 보기에도 제1, 3사분면에 관측치가 많아 보인다. 정말 그런지 상관계수를 계산해보자. cor() 함수로 상관계수 구하기1234> cor(heights) father sonfather 1.0000000 0.5010.. R/R 프로젝트 2018. 8. 3. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 78일차 공부 페이지322 페이지 ~ 323 페이지 배운 개념산점도 그리기1> plot(heights, pch=16, col=rgb(0.2, 0.2, 0.2, 0.5))cs 두 개의 상자그림으로는 두 변수의 관계를 알아낼 수 있다. 관계를 알아내기 위해서는 요약하기 전의 값을 살펴봐야 한다. 두 변수의 값을 그대로 좌표로 활용한 산점도를 그려보자. 첫 번째 변수 father를 가로축(x축) 좌표로, 두 번째 변수 son을 세로축(y축) 좌표로 활용해서 2차원 공간에 점을 찍는다. 관측치의 개수인 1,078개의 점이 찍히고, 이 점이 만들어내는 패턴으로 두 변수의 관계를 찾아보자. pch= 옵션으로 점 모양을 바꾸고, col= 옵션과 rgb() 함수를 활요해 불투명한 회색으로 표현했다. 보조선 추가하기 좀 더 효과.. R/R 프로젝트 2018. 8. 2. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 77일차 공부 페이지321 페이지 배운 개념아들의 키 히스토그램으로 살펴보기1> hist(heights$son)cs 다음 시간에 배울 것산점도 그리기 R/R 프로젝트 2018. 8. 1. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 76일차 공부 페이지321 페이지 배운 개념상자그림 해석 전체적으로 아들키의 상자그림이 아빠 키의 상자그림보다 조금 더 높이 걸려 있다. 즉, 세대가 지나면서 전반적으로 키가 커진 것을 알 수 있다. 따라서 중앙값도 커지고, 평균도 높아졌다. 최댓값도 더 커졌지만, 그러나 최솟값은 더 작아졌다. 두 상자그림에서 키 분포의 특징을 살펴볼 수 있다. 연봉 데이터와는 달리 중간 50% 구간의 간격은 좁고, 위아래 구간의 간격이 넓은 것이 보인다. 키가 많이 작거나 많이 큰 일부를 제외하면 대부분 중앙값 근처의 무난하 키를 가지고 있는 좌우 대칭 분포 형태를 보인다. 다음 시간에 배울 것아들의 키 히스토그램으로 살펴보기 R/R 프로젝트 2018. 7. 31. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 75일차 공부 페이지320 페이지 배운 개념아빠 키와 아들 키 Summary() 함수로 출력하기12345678> summary(heights) father son Min. :149.9 Min. :148.6 1st Qu.:167.1 1st Qu.:170.0 Median :172.1 Median :174.3 Mean :171.9 Mean :174.5 3rd Qu.:176.8 3rd Qu.:179.0 Max. :191.6 Max. :199.0 cs 상자 그림으로 아버지 키 표현하기상자 그림으로는 하나의 변수밖에 그릴 수 없다. 아버지 키와 아들 키, 두 변수 각각 상자그림으로 그려야 한다.그러나, R의 plot() 함수는 두 상자 그림을 나란하게 그려준다. 1> boxplot(heights)cs 다음 시간에 배울 것상.. R/R 프로젝트 2018. 7. 30. [리뷰] 이토록 쉬운 퉁계&R 책 표지가 상당히 재치있는(?) 책이다. 이 포스팅에서 소개한 대로 포스팅 이벤트로 받았다! '이토록 쉬운'에 맞게 굉장히 입문자에 맞게 서술이 되어있다. 개인적으로 고등학생 정도만 돼도 읽을 수 있는 수준이라고 느낀다! 물론 고등학교를 졸업했다면 더욱 쉽게 읽을 수 있다. Part 1 에는 중고등학교 때 배운 간단한 확률 통계 지식 수준의, 기술통계를 알려준다. Part 2 에는 확률개론에서 배우는 조건부 확률과 상관 계수 수준의, 기술통계를 알려준다. 더불어 의사결정나무 모형과 추리통계 부분인 분산분석 ANOVA를 알려준다. Part 3 에는 본격적으로 추리통계로 들어간다. 표본과 모집단부터 해서 각종 검정까지 알려준다. 각 검정의 의미까지 쉽고 자세하게 알려준다! Part 4 에는 R을 다루는 기본.. 도서/IT 도서 2018. 7. 29. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 74일차 공부 페이지318 페이지 ~ 319 페이지 배운 개념두 개의 연속형 변수의 관계 찾기과연 아빠의 키는 아들 키에 얼마나 큰 영향을 줄까? 이전에 살펴본, 피어슨의 데이터를 불러와보자 123456789101112131415161718> Sys.setlocale('LC_ALL' , 'ko_KR.UTF-8')[1] "ko_KR.UTF-8/ko_KR.UTF-8/ko_KR.UTF-8/C/ko_KR.UTF-8/C" > setwd("~/Documents/Workspace/R/Practice/data") > heights = read.csv('heights.csv', fileEncoding = "euc-kr") > head(heights) father son1 165.2 151.82 160.7 160.63 165.0 .. R/R 프로젝트 2018. 7. 29. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 73일차 공부 페이지317 페이지 배운 개념대응분석 그림 해석 50세 이상의 연령대도 함께 모여있다. 이 연령대에서의 주상병 분포 패턴이 비슷하다는 의미이다. 50세 이상의 연령대와 N18, I10, E11 상병이 가까운 것은 다른 상병이나 연령대보다 상대적으로 더 밀접한 관계가 있다는 것을 의미한다. J20의 경우 낮은 연령대와 관련이 깊고, K21과 K29가 위쪽에 있는 것은 함께 위쪽에 있는 중간 연령대와 비교적 관련이 깊다는 것을 의미한다. 즉, 대응분석은 같은 변수 속에 있는 서로 비슷한 패턴을 보이는 수준들을 묶어주고, 또 다른 변수에 있는 서로 비중이 높아 관련이 깊은 수준을 묶어준다. 다음 시간에 배울 것두 개의 연속형 변수의 관계 찾기 R/R 프로젝트 2018. 7. 28. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 72일차 공부 페이지317 페이지 배운 개념대응분석 그림 해석 첫 번째 축에 적힌 82.7%는 진료과목과 연령대로 엉켜 있는 모든 차이의 82.7%를 설명한다는 것을 의미한다. 어떤 정보들이 있을까? 파란색 점들은 MAIN_SICK 수준들이고, 빨간 점들은 연령대이다. 왼쪽에 따라 N18, I10, E11이 모여 있는데, 이 3개의 주상병은 연령대 구성이 비슷하다는 의미이다. 다음 시간에 배울 것대응 분석 그림 해석 (3) R/R 프로젝트 2018. 7. 27. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 71일차 공부 페이지317 페이지 배운 개념대응분석 그림 해석 첫 번째(가로) 축에는 82.7%, 두 번째(세로) 축에는 12.9% 라는 숫자가 적혀 있다. 직접 행 백분율과 열 백분율을 살펴보면, 연령대별로 상대적으로 비중이 높은 주상병, 혹은 특정 주상병에서 상대적으로 비중이 높은 연령대를 확인할 수 있다. 어린이는 급성기관지염(J20), 중년은 고혈압(I20)이나 당뇨(11), 노년은 신장병(N18)과 관련이 깊다. 반대로 관련이 없거나, 크진 않지만 조금 관련이 있거나 역시 크진 않지만 조금 덜 관련이 있을 수도 있다. 다음 시간에 배울 것대응분석 그림 해석 (2) R/R 프로젝트 2018. 7. 26. [ 이토록 쉬운 통계&R 100일 프로젝트 ] 70일차 공부 페이지316 페이지 배운 개념대응분석 R 실습12345> installed.packages("ca") > library(ca) > plot(ca(t_MS_AGE2))cs Install.packages() 함수로 ca 패키지를 설치하고 library() 함수로 불러옵니다. 그리고 만든 교차표를 ca() 함수에 넣고 plot() 함수로 그림을 그린다. 다음 시간에 배울 것대응분석 그림 해석 R/R 프로젝트 2018. 7. 25. [리뷰] 객체지향의 사실과 오해 표지가 토끼 모양이다! 언어로 먼저 객체지향을 배웠지만,객체지향의 감이 잡히지 않았을 때 읽으면 좋은 책이다. 이상한 나라의 앨리스와 그 토끼에 대한 내용으로 이야기를 쉽게 전달하고자 한다. 개인적으로, 흐름이 좀 단조롭고 지루하다고 느꼈는데, 내용 자체는 훌륭하다.핵심 내용 위주로 읽는다면, 읽기 좀 수월할 것이다! 이 책은 서재에 꽂아 놓고 두고두고 심심할 때 읽어볼 수 있다. 도서/IT 도서 2018. 7. 24. 이전 1 ··· 26 27 28 29 30 31 32 ··· 45 다음