본문 바로가기

반응형

학습공간/데이터마이닝방법론1

(4)

[3주차] Empirical Process 1 (데이터 기반 추정) Empirical Process 1 (경험 과정) 분포를 모를 때, 샘플 데이터 \(X_1\),... ,\(X_n\) 에 의존한 추정 기법을 다룬다. 앞의 1~2주차는 머신러닝을 위한 기초 수리통계 이론이며, 실제 머신러닝은 Data-Driven(고등 수리통계) 이론을 따른다. ※ 일반 수리통계(Classical mathematics statistics) 이론은 분포가 중요하며 분포의 parameter 추정이 주요 목표이다. · e.g.) 정규분포 \(N(\mu\,,\sigma^2)\) 1. 확률변수(random variable) · X : Ω → R 2. 조건확률/기대치(conditional probability and expectation) 3. 확률변수의 분포(r.v. of distribution)..
[2주차] 조건확률 이론 (조건확률, 기대값) 지난 1주차 수리통계 기초에서는 확률공간과 확률변수에 대한 개념을 다뤄보았다. 또한 확률변수가 취할 수 있는 수치에 대한 확률값을 나타내는 분포함수의 특징과, 2가지 경우(이산: 확률질량함수, 연속: 확률밀도함수)에 대한 표기법도 알게 되었다. 이제, 조건확률(Conditional Probability)과 조건기대치(Conditional Expectation)에 대해 알아보자. ※ 선행학습 - 기대치(Expectation)와 르베그적분(Lebesgue Integral)에 대하여.. - 기대치(Expectation) - Expectation of X on \({\color{Red}(\Omega, \mathcal{F}, P)}\) → 확률공간(Ω)에 대한 X 의 기대값 · 기대치 또는 기대값이라고 하며, 모..
[1주차] 수리통계 기초 (확률공간, 확률변수) 머신러닝 개발을 위한 통계적 학습 이론(Statistical Learning Theory, 이하 SLT)은 빅데이터를 처리하기 위한 고등 수리통계이론이다. 인공지능 개발자로서의 최소 기본이론이며, 코딩은 다루지 않고 수학적 이론을 위주로 진행한다. 먼저, 확률공간(Probability Space)과 확률변수(Random Variable)에 대해 알아보자. 1. 확률공간(Ω, F, Pr)은 공간 전체의 측도가 1인 측도 공간이다. (표기: Pr(Ω) = 1) - 측도(영어: measure)는 특정 부분 집합에 대해 일종의 '크기'를 부여하며, 그 크기를 가산개로 쪼개어 계산할 수 있게 하는 함수이다. 즉, 어떠한 사건 S 가 표본들의 집합 Ω 의 부분 집합일 경우, 가산개의 사건들이 주어졌을 때 어떤 사건..
[Intro] 데이터마이닝방법론1 학습공간 성균관대학교 산업공학과 석박사과정에서 다루는 데이터마이닝방법론이다. 데이터마이닝연구세미나 → 데이터마이닝방법론1 → 데이터마이닝방법론2 학습 순서의 2번째 단계에 해당된다. 1960년대 이후부터 컴퓨터가 발달하고 수집된 빅데이터 분석을 보면 기존 노말 분포는 잘 맞지 않으며 MLE 방법이 최선이 아님을 알게 되었다. 이에따라 데이터 분석에 대한 새로운 이론이 필요히게 되었으며 SLT 이론이 등장하게 되었다. 1. 데이터마이닝연구세미나 : 머신러닝 관련 기본수학인 선형대수학(Convex Analysis)과 최적화이론(Non-linear Programming)에 대해 다룬다. 여기서 선형대수학은 일반 수학과는 달리 n차원 공간에 대한 기하학적 구조에 대해 공부하며 그 이해도를 높이는데 초점이 있다. 2. 데..
반응형