728x90
공부 페이지
110 페이지 ~ 121 페이지
배운 개념
분할 정복(Divide and conquer)
데이터를 여러 개의 작은 부분을 쪼개고, 나뉜 부분별로 분석 하는 방법
의사결정나무 모형
모든 설명 변수가 아니라 중요한 변수들만 선택해서 차이를 설명함. 그 방법을 의사결정나무로 표현함.
가장 중요한 단 하나의 변수만 선택해서 조건을 만들어 가지를 뻗는다. 그 다음 중요한 변수를 선택해 또 가지를 뻗는다. 그리고 적절한 순간이 오면 가지치기를 해서 의미 없는 잔가지를 덜어낸다.
타이타닉 예시로 의사결정나무 모형 과정을 살펴봤다. 큰 차이를 만들어내는 설명 변수로 조건을 만들어 가지를 뻗어갔다.
의사결정나무 모형을 구현하는 알고리즘은 복잡하지만, 결과는 직관적이고 이해하기가 쉽다. 비교적 최근 이론이다.
다음 시간에 배울 것
조금 오래된, 또 다른 통계학자들의 노력의 산물들을 살펴본다.
'R > R 프로젝트' 카테고리의 다른 글
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 17일차 (0) | 2018.06.02 |
---|---|
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 16일차 (0) | 2018.06.01 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 14일차 (0) | 2018.05.30 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 13일차 (0) | 2018.05.29 |
[ 이토록 쉬운 통계&R 100일 프로젝트 ] 12일차 (0) | 2018.05.28 |
댓글