현실의 어떠한 문제를 해결하기 위해서 어떠한 모델을 세웠으면 그 모델이 어느정도의 성능을 내고 있는지 평가할 필요가 있다. 따라서 보통 위와 같이 데이터를 훈련용, 검증용, 테스트용 이렇게 3가지로 분리하는 것이 일반적이다. 3가지로 분류하는 이유 1. 훈련데이터 = 문제지 2. 검증데이터 = 모의고사 3. 테스트데이터 = 실제시험 이렇게 비유할 수 있는데 검증용 데이터는 모델의 성능을 평가하기 위한 데이터가 아니라 성능을 조절하기 위해서 필요한 데이터이다. 과적합(Overfitting)을 판단하거나 하이퍼 파라미터의 값을 조정하기 위해서 필요하다. #하이퍼파라미터(초매개변수)와 매개변수 하이퍼파라미터는 매개변수와 달리 값에 따라서 모델의 성능에 영향을 주는 매개변수를 말한다. 반면 매개변수는 모델이 학..
1. 정규화 정규화란 데이터의 일관성, 최소한의 데이터 중복, 최대한의 데이터 유연성을 확보하기 위해서 데이터를 분해하는 과정을 말합니다. 이러한 정규화를 거치게되면 비즈니스(업무)에 변화가 발생하더라도 데이터 모델의 변경을 최소하 할 수 있습니다. 제5 정구화까지 존재하지만 실질적으로는 보통 제3 정규화까지만 수행하기 때문에 이 포스팅에서는 제3 정규화까지만 알아보도록 하겠습니다. #정규화절차 정규화 절차 설명 제1 정규화 - 속성(Attibute)의 원자성을 확보한다 - 기본키를 설정한다 제2 정규화 - 기본키가 2개 이상의 속성으로 이루어진 경우, 부분 함수 종속성을 제거한다 제3 정규화 - 기본키를 제외한 컬럼간의 종속성을 제거한다. - 즉, 이행 함수 종속성을 제거한다. BCNF - 기본키를..
(이글은 네이버 블로그 운영당시 작성한 글을 옮기었습니다. 따라서 2019년에 작성된 글입니다.) 1. 데이터 모델링의 이해 우리의 목적은 관계형 데이터베이스, 즉 표에 정보를 담는 것인데, 정보를 데이터베이스 표에 담는 것에 성공만하면 거대한양의 데이터를 데이터베이스가 가진 장점들을 활용하여 다룰 수 있게 되기 때문입니다. 하지만 무한히 거대하고 복잡한 현실을 정보로 만들어서 표에담는 것은 결코 간단하지 않습니다. 이러한 복잡한 현실을 데이터베이스화 시키는 것이 바로 데이터 모델링인데요. 따라서 데이터 모델링은 현실세계를 데이터베이스로 표현하기 위해서 우리는 추상화라는 것을 하게되고 그러기 위해서는 그 데이터와 관련된 업무파악을 해야합니다. 업무파악이 끝났으면 현실의 업무를 뜯어내서 개념을 찾아..
이 포스팅은 학교 수업때 교수님이 저술하신 책을 읽고 자신의 생각을 작성하는 보고서를 올린 포스팅입니다. 책의 매우 일부분만을 다룬 보고서이며, 학부생이 작성한 글이기에 다소 편협할 수 있으며 수 있습니다. 대표사진 삭제 교수님께서 읽으라고 한책 감정노동, 감정부조화 그리고 직무소진에 대한 Review 충북대학교 경영정보학과 이우석(2013026033) Index 1. Review 방법 2. Under Line & Under Line Thinkg 2.1 감정부조화를 극복하는 힘 2.2 감정부조화를 잘 극복하는 조직문화란? 2.3 조직의 규범을 수용하면서도 자신의 정체성을 유지하는 방법이란? 3. Summary(요약 및 정리) 1. Review 방법 나는 책을 읽으면서 어떠 한 절이나 구문은 생각을 자극하..