일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- pip
- slideshare
- install
- Vim
- code
- paper_review
- tab
- text
- gensim
- seq2seq
- natural_language_processing
- Statistics
- computer_setting
- linux
- github
- language_model
- Stanford
- deeplearning
- git
- review
- json
- terminal
- error
- cs224n
- Standford
- machinelearning
- cs231n
- nlp
- computer
- Ai
- Today
- Total
목록Statistics/수리통계 (11)
NLP/AI/Statistics
Chap.6에서는 점추정에 대하여 설명한다. 점추정이란 추정하고자 하는 모집단에서 임의로 추출된 n개 표본의 확률변수로 하나의 통계량을 만들고 주어진 표본으로부터 그 값을 계산하여 하나의 수치를 제시하기 위한 것이다. 점추정에 대하여 아래와 같은 목차로 설명할 예정이다. 6.1) 기술통계학 6.2) 순서통계량 6.3) 최우추정 6.4) 충분통계량 6.5) 베이지안 추정 이번 글에서는 각 통계량의 특성과 정의에 대하여 정리하면서 추정량과 추정치에 대하여 설명하기 때문에 이전보다 이해하기 쉬울 것으로 보인다. 6.1) 기술통계학 사전적으로 기술통계학은 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법을 의미한다. - wikipedia 실제로 확률실험을 ..
Chap4에서는 이변량 분포에 대하여 설명한다. 목차는 아래와 같이 구성된다. 4.1) 이산형 이변량 분포(결합확률질량함수, 주변확률질량함수) 4.2) 상관계수(공분산, 상관계수, 최소제곱 회귀직선) 4.3) 조건부 분포 4.4) 연속형 이변량 분포 4.5) 이변량 정규분포 우선, 이변량 분포는 두 확률변수에 대한 결합 확률 분포를 의미하며 빈도 분석, 단순상관 분석, 회귀 분석 등이 이변량 분포의 형태를 나타내는 분석기법이다. 4.1) 이산형 이변량 분포 이산형 확률공간에서 정의된 두 개의 확률 변수 $X$, $Y$에 대하여, $X$와 $Y$에 대응하는 2차원 공간을 $s$라고 할 때, $X = x, Y= y$인 확률을 $f(x, y) = P(X=x, Y=y)$라고 표현한다. 이때 $f(x, y)$는 ..
Chap3에서는 연속형 확률분포에 대하여 설명하고자 한다. 연속형 확률변수에 대하여 아래와 같이 설명할 예정이다. 3.1) 연속형 확률변수 (균일분포, 확률밀도함수, 백분위수) 3.2) 지수, 감마, 카이제곱분포 (지수분포, 감마분포, 카이제곱분포) 3.3) 정규분포 (정규분포, 표준정규분포) 3.1) 연속형 확률변수 정수와 같이 명확한 값을 변수값으로 갖는 이산형 확률변수와 달리, 연속형 확률변수는 명확한 값을 갖지 않는다. 확률 변수 $X$가 구간 $[a,b], -\infty < a < b < \infty$로부터 임의로 선택된 하나의 점의 위치라고 할 때, $[a,x], a \leq x < b$로부터 선택될 확률은 $\frac{x-a}{b-a}$이다. 이 때 $X$의 cdf는 다음과 같다. $$F(x..