- 손정의 "10년 안에 인류 뛰어넘는 AI 실현될 것 2023년을 대표할 수 있는 가장 Hot Keyword를 꼽으라고한다면 ChatGPT가 빠질 수 없다. ChatGPT는 OpenAI에서 개발한 자연어 처리 모델로서 사용자와의 대화에서 인상적인 자연어 생성 능력을 보여주었다. 이는 급격한 AI 기술 발전을 일반인들이 체감할 수 있게 해주고 있으며 실로 어마어마한 관심을 받고있다. 이러한 ChatGPT는 월간 사용자 1억을 달성하는데 겨우 2달밖에 걸리지 않았다. 월간 액티브 유저 1억명을 달성하는데 틱톡(TikTok)이 9개월, 인스타그램(Instagram)은 2년 6개월이 소요된 것에 비하면 경이로운 기록이며 그만큼 세계의 이목과 관심이 쏠리고 있다. ChatGPT의 등장으로 대기업들도 충격을 받고..
인공 신경망의 기본 개념은 인간의 뇌의 작동 원리를 모방하겠다는 아주 창의적이면서도 심플한 아이디어이다. 그런데 막상 인간의 뇌는 어떻게 작동하는 걸까? # 뉴런(Neuron) : 신경세포 뉴런은 전기적 신호와 화확적 신호를 전달하는 기능을 가지며 서로 연결되어 네트워크를 형성한다. 전기적 신호는 뭐야? : 뉴런 내부의 양극성(전기적 차이)이 일정수준 일정 수준이상으로 증가하면 액체로 이루어진 시냅스(뉴런과 뉴런을 연결하는 구조물) 부위에서 전기적인 신호가 발생하게 된다. 화학적 신호? : 뉴런간에 신경전달물질을 통해 신호를 전달하는 방법으로 화학적인 신호는 전기적인 시호보다 전달속도는 느리다. 하지만 시냅스간의 거리가 멀거나 연결이 약한 경우에도 신호 전달이 가능하다는 장점을 가지고 있다. 인공신경망은..
랜덤포레스트는 의사결정트리를 이용해 만들어진 것으로 여러개의 의사결정트리를 만들고, 투표를 시켜 다수결로 결과를 결정하는 방법을 말한다. 왜 여러개의 DecisionTree를 생성할까? 그것은 각각의 트리들이 서로 다른 데이터셋과 무작위로 선택된 feature를 통해서 학습되기 때문이다. 이렇게 트리들이 서로 다른 데이터와 feature를 통해 학습되기 때문에 Tree들이 다양한 시각에서 데이터를 바라볼 수 있게 된다. 따라서 그냥 DecisionTree를 사용하는 것보다 이러한 여러개의 DecisionTree 들을 모아서 투표를 진행하게된다. 그렇다면, 이 투표는 어떻게 진행될까? 말 그대로 다수결 투표이다. 간단한 예시를 통해서 이해하고 넘어가자 예를 들어, 3개의 Decision Tree 모델이 있..
현실의 어떠한 문제를 해결하기 위해서 어떠한 모델을 세웠으면 그 모델이 어느정도의 성능을 내고 있는지 평가할 필요가 있다. 따라서 보통 위와 같이 데이터를 훈련용, 검증용, 테스트용 이렇게 3가지로 분리하는 것이 일반적이다. 3가지로 분류하는 이유 1. 훈련데이터 = 문제지 2. 검증데이터 = 모의고사 3. 테스트데이터 = 실제시험 이렇게 비유할 수 있는데 검증용 데이터는 모델의 성능을 평가하기 위한 데이터가 아니라 성능을 조절하기 위해서 필요한 데이터이다. 과적합(Overfitting)을 판단하거나 하이퍼 파라미터의 값을 조정하기 위해서 필요하다. #하이퍼파라미터(초매개변수)와 매개변수 하이퍼파라미터는 매개변수와 달리 값에 따라서 모델의 성능에 영향을 주는 매개변수를 말한다. 반면 매개변수는 모델이 학..
파이썬을 사용하고 있는 사용자들은 다른 훌륭한 개발자들이 만들어놓은 모듈 및 패키지를 사용할 떄마다 pip를 통해서 설치한다. pip를 통해서 파이선으로 제작된 패키지들을 설치한다는 것은 직감적으로 알겠는데 그렇다면 pip는 정확히 어떤 원리로 동작하는 것일까? 1. PyPI Python Package Index의 줄임말로 파이썬으로 만든 패키지들을 관리하고 열람하는 저장소를 말한다. PyPI는 파이선 패키지에 Index를 붙여서 관리하는 모습으로 상상하면 편하다. 우리가 스마트폰 어플리케이션을 설치하기 위해서 AppStore에서 개발자들이 올린 앱을 다운받는 것처럼 PyPI는 앱스토어와 같은 역할을 한다고 보면된다. 결국 pip는 우리가 AppStore에 들어가기위해서 Google Play 혹은 One..
공공 API 활용하기¶ 활용신청한 API : https://www.data.go.kr/iim/api/selectAPIAcountView.do 2020년 3월~8월 10일 코로나 환자 데이터 필요한 라이브러리 import In [5]: # import library import requests, xmltodict, json import numpy as np import pandas as pd import matplotlib.pyplot as plt URL 작성 및 요청 In [7]: url = 'http://openapi.data.go.kr/openapi/service/rest/Covid19/getCovid19SidoInfStateJson?serviceKey=YNeaX1XgA%2BRIzGp1lEkTr00t..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.