R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 92일차

Chipmunks 2018. 8. 16.
728x90



공부 페이지

336 페이지


배운 개념

트리 모형 적합하기

1
2
3
4
5
6
7
8
9
10
11
12
> rpart_call = rpart(통화건수~시군구+연령대+성별+요일, data=call_chicken)
 
> rpart_call
n= 8390 
 
node), split, n, deviance, yval
      * denotes terminal node
 
 1) root 8390 21661930.00  61.12431  
   2) 연령대=10대,50대,60대이상 4190  1370614.00  31.41575  
     4) 시군구=강북구,관악구,광진구,구로구,금천구,도봉구,동대문구,동작구,마포구,서대문구,서초구,성동구,성북구,양천구,용산구,은평구,종로구,중구,중랑구 3182   516057.20  25.93652 *
(이하 생략)
cs


트리 모형은 하나의 변수를 활용한 조건으로 하나의 그룹을 2개의 작은 그룹으로 나눈다. 그리고 나눠진 그룹을 또다시 2개씩 더 작은 그룹으로 나누는 작업을 반복한다. rpart_call 으로 살펴보면 결과를 확이할 수 있지만, rpart.plot() 함수로 그림을 그릴 수 있다.

다음 시간에 배울 것

트리모형 시각화해보기

댓글