이번 포스팅에서도 마찬가지로 확률에 대한 부분으로서 확률에서 가장 많이 쓰이는 개념은 조건부 확률에 대해서 알아보고 이 조건부 확률 개념을 응용한 베이즈 정리에 대해서도 짚고 넘어가보도록 하겠습니다. 1. 조건부 확률 조건부 확률이란 어떤 사건 B가 일어났다는 조건 아래 사건 A가 일어날 확률을 조건부확률이라 부르고 다음과 같이 정의합니다. 조건부 확률 예제를 한번 살펴보도록 하겠습니다. 어떤 모임에는 남자가 5명, 여자가 6명으로 구성되었다. 남자 중에는 2명이 안경을 쓰고 있고 여자 중에는 4명이 안경을 쓰고 있다고 한다. 임의의 한 명을 뽑았을 때, "이 사람이 안경을 쓰고 있다."라는 정보를 알고 있을 때, 그 사람이 남자일 확률은 얼마인가? 위 조건부 확률 공식을 그대로 대입하..
안녕하세요. 이번 포스팅에서는 앞으로 다룰 통계학 내용들과 함께 사용될 R과 R Studio이라는 툴을 설치하고 실행해보는 시간을 가져보도록 하겠습니다. 구글에 R, R Studio 2개를 검색하셔서 다운받으시거나 아래의 해당링크에서 다운받으셔서 설치해주면 되고 설치 방법은 어려울거 없이 간단하게 전부다 Next를 눌러서 설치해주시면 됩니다. R : https://cran.r-project.org/bin/windows/base/ Download R-4.0.2 for Windows. The R-project for statistical computing. If you want to double-check that the package you have downloaded matches the package ..
안녕하세요. 저번 [R과 통계학 -1] 포스팅에 이어서 두번째 포스팅입니다. 이번 포스팅에서는 확률에 대한 부분중 기초적인 부분만 다루기 때문에 R과 관련된 내용을 작성하지 않았습니다. 그럼 확률에 대한 개념을 정리하고 넘어가기 위해서 사상, 확률변수, 확률의 성질, 그리고 순열과 조합에 대해서 정리해보는 시간을 가져보도록 하겠습니다. 1. 사상과 확률 변수 고등학교 시간에 확률에 대해서 배우면 주사위, 동전 던지기에 대해서 많이 접해보았을텐데요. 이처럼 주사위 던지기, 동전 던지기 처럼 던지는 '행위'에 의해 생긴 결과를 '사상'이라고 합니다. 이러한 사상이 어느 정도 일어나기 쉬운지를 수치화한 것이 확률이고 모든 사상에 대한 확률을 합하면 그것은 1(100%)가 됩니다. 그렇다면 확률변수란..
이번에 제가 쓰려고 하는 [R과 통계학]이라는 시리즈에서는 지금까지 제가 학교나 책에서 배운 R 그리고 통계학에 대해서 글로 정리하여 데이터 분석에 관심이 있는 독자분들에게 도움이 되었으면 합니다. 현재 우리는 SAS나 SPSS, R 같은 통계 프로그램 툴을 활용하면 수학 공식에 얽메이지 않고 개념적인 수준에서 통계학을 공부할 수 있습니다. 다만 통계학적 지식없이 통계학 프로그램을 사용하는 것은 경우에 따라 큰 오해와 피해를 불러일으킬 수 있으므로 어느정도 통계학적 지식은 필요하다고 생각합니다. 저도 경영대학생이고 일단 주먹구구식으로 일단 책을사고 선행과목도 안 듣고 통계학과 2~4학년 과목을 들으면서 공부해왔던지라 이런저런 시행착오(?)라 해야할까요? 아무튼 R과 통계학을 공부하면서 느꼈던 어려..
안녕하세요. 이번 포스팅은 이전에 작성한 빅데이터 기초1~3 시리즈 포스팅글과 관련해서 도움이 될만한 책을 같이 공유해봤으면 좋겠다는 생각에 구도 다쿠야라는 분이 지은 '앞으로 데이터 분석을 시작하려는 사람을 위한책'에 대한 독서 정리글을 작성해보고자 합니다. "The data never lies" (데이터는 거짓말을 하지 않는다) 미국연방정부 의료IT 정책 사무실 국장 파자드 모스타샤리(Fazad Mosta-shari)가 입에 달고 다니던 말이라고 합니다. 책에 내용에 의하면 올바른 수단으로 수집하여 가공되지 않은 데이터(raw data)는 절대 거짓말을 하지않고 그런 데이터를 바탕으로 올바르게 도출한 분석 결과는 기업이나 여타 조직이 현재 상황을 파악하도록 도울 뿐만 아니라 앞으..