R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] 84일차

Chipmunks 2018. 8. 8.
728x90



공부 페이지

328 페이지 ~ 329 페이지


배운 개념

살충제별 성능 차이 데이터, 그룹에 따라 데이터를 요약해보기

1
2
3
4
5
6
7
8
> aggregate(count ~ spray, data=InsectSprays, mean)
  spray     count
1     A 14.500000
2     B 15.333333
3     C  2.083333
4     D  4.916667
5     E  3.500000
6     F 16.666667
cs


"data=" 옵션에 데이터 이름을 넣고 앞쪽에는 모형식을 적는다.

궁금한 것은 살충제라는 그룹마다 죽은 벌레 수이기 때문에, 벌레 수 count가 먼저 나온다. ~ 다음으로 살충제 spray가 붙는다. 제일 마지막에는 그룹별로 계산할 함수를 적는다. 그룹별 평균을 계산하기 위해 "mean"을 넣었다.


결과를 살펴보면 살충제 A, B, F는 14마리 이상의 꽤 많은 벌레를 죽인 반면 C, D, E는 효과가 그다지 좋지 않다. 좀 더 차이를 확실하게 볼 수 있도록 그룹별로 상자그림을 보려보자. 그룹별 평균은 숫자 하나로 그룹의 특징을 간편하게 비교할 수 있지만, 그룹별 상자그림은 전반적인 분포를 비교할 수 있다.


1
> boxplot(count ~ spray, data=InsectSprays)
cs



다음 시간에 배울 것

boxplot 결과 살펴보기.



댓글