안녕하세요. 이번 포스팅은 이전에 작성한 빅데이터 기초1~3 시리즈 포스팅글과 관련해서 도움이 될만한 책을 같이 공유해봤으면 좋겠다는 생각에 구도 다쿠야라는 분이 지은 '앞으로 데이터 분석을 시작하려는 사람을 위한책'에 대한 독서 정리글을 작성해보고자 합니다. "The data never lies" (데이터는 거짓말을 하지 않는다) 미국연방정부 의료IT 정책 사무실 국장 파자드 모스타샤리(Fazad Mosta-shari)가 입에 달고 다니던 말이라고 합니다. 책에 내용에 의하면 올바른 수단으로 수집하여 가공되지 않은 데이터(raw data)는 절대 거짓말을 하지않고 그런 데이터를 바탕으로 올바르게 도출한 분석 결과는 기업이나 여타 조직이 현재 상황을 파악하도록 도울 뿐만 아니라 앞으..
- 들어가며 이번 포스팅에서는 이전 빅데이터 기초1 포스팅의 내용에 이어지는 내용으로 빅데이터의 개념을 이해했으니 빅데이터는 어떠한 처리과정을 거치는지에 대해서 알아보고 그 처리과정 중 데이터를 수집하는 방법론에 대해서 살펴보고자 합니다. 이번 포스팅도 마찬가지로 이해하시려면 DB(Database)에 대한 개념이 어느정도 있으면 이해하기 쉽겠지만 DB에 대해서 잘 알지 못하시는분들에게도(D알못도) 이해하기 쉽도록 최대한 풀어서 글을 작성해보고자 합니다. 그리고 이 포스팅은 데이터를 수집하는 방법론이기 때문에 이글에서 소개해드리는 데이터 수집기술들에 대한 구체적인 방법에 대해서는 다루지 않습니다. (어차피 이러한 기술들은 금방사리지고 금방 새로운게 나오고 합니다....) 데이터를 수집하는 기술들..