R/R 프로젝트

[ 이토록 쉬운 통계&R 100일 프로젝트 ] Day 1. 우리는 내일이 궁금합니다.

Chipmunks 2018. 3. 13.
728x90

[ 이토록 쉬운 통계&R 100일 프로젝트 ] Day 1. 우리는 내일이 궁금합니다.



우리는 내일이 궁금합니다.

내일을 예측하기 위해서 아주 오래 전 부터 많은 방법들을 사용해왔다.

전쟁의 승패를 점치기 위해 신을 모시는 사제를 찾거나 하늘의 별을 보며 앞날을 예측했다.

지금도 마찬가지이다.


과거와 달라진 점이 있다면 선택지가 수없이 많아져 내일을 예측하기가 더욱 어려워졌다.

더이상 사람의 눈으로는 복잡하게 얽힌 오늘을 해석하는 것이 쉽지 않다.


그래서 필요한 것이 데이터 분석 이다.



데이터란 무엇인가

우리가 남긴 어제의 기록이다. 그 당시에는 너무 빠르고 복잡해서 놓친 정보가 흔적이 되어 남아있다.


그래서 데이터를 잘 살펴보면 그 속에서 인사이트[각주:1]를 찾을 수 있고, 내일을 내다볼 수 있는 힌트를 얻을 수 있다.



데이터 분석을 배우기 위해서 어디서부터 시작해야 할까?

어떤 데이터 분석이든 목적과 과정을 살펴보면 어떤 차이를 확인하고 설명하려 한다.


넷플릭스가 데이터에서 콘텐츠 이용 패턴을 찾아 성향 차이를 확인하고 사람들이 더 좋아할 영화를 추천해주듯이


데이터 분석은 이 차이라는 개념을 이해하는 것으로부터 시작된다.


바로 통계학차이설명하는 학문이다.



통계학

통계학은 차이를 수학이라는 도구로 풀어낸다. 아무리 쉽게 설명하려 해도 수식을 피해갈 수는 없다.


그러히만 데이터 분석을 위해 그 많은 수식을 꼭 알아야 하는 것은 아니다.


수식은 통계의 개념을 논리적으로 설명한 표현이지 본질은 아니기 때문이다.


앞으로 복잡한 수식보다 그 속에 담긴 통계의 개념을 중점적으로 이야기 할 것이다.


그 뒤에는 분석 도구 R을 소개한다. 아무리 통계 개념이 중요하다 하더라도 실제 분석에 적용하지 못하면 아무런 쓸모가 없다.


간단한 예제 분석을 직접 따라 해봄면 개념을 이해하고 적용하는데 도움이 될 것이다.





  1. 긍정적인 결과로 이어질 수 있는 내외적인 기회에 대한 창의적 해석 [본문으로]

댓글