1. 이산확률분포
- 이항분포 binomial distribution
- 베르누이 시행: 사건의 결과가 상호 배타적인 두 개 뿐인 시행
- P(X=x) = _nC_x p^x q^{n-x} ={n \choose x} p^x q^{n-x} ; x = 0, 1, 2, \dots, n
- 평균: E(X) = np
- 분산: V(X) = npq = np(1-p)
- p=0.5 이면 기댓값에 대해 좌우대칭
- np \geq 5, nq \geq 5 일 때, 정규분포에 근사
- p \leq 0.1, n \geq 50 일 때, 푸아송분포에 근사
- 푸아송분포 poisson distribution
- 고정된 시간이나 공간에서 일어나기 드문 사건을 설명
- P(X=x) = \frac{e^{- \lambda} \lambda^x}{x !} ; x = 0, 1, 2, \dots, n, \lambda = 단위시간 당 평균 발생횟수
- 평균: E(X) = \lambda
- 분산: V(X) = \lambda
- 초기하분포 hypergeometric distribution
- 매 시행마다 성공확률이 일정하지 않을 때, 매 시행이 종속적(비복원추출)일 경우
- 모딥단의 크기가 충분히 크고, \frac{m}{N} = P 로 일정한 경우 이항분포로 근사
- P(X=x) = \frac{{m \choose x}{{N-m} \choose {n-x}}}{{N \choose n}} ; x = 0, 1, 2, \dots, ,min(m, n)
- 평균: E(X) = np
- 분산: V(X) = \frac{N - n}{N -1} np(1-p), p =\frac{m}{N}
- 기하분포 geometric distribution
- P(X=x) =p(1-p)^{x-1}
- 평균: E(X) =\frac{1}{p}
- 분산: V(X) = \frac{1-p}{p^2}
2. 연속확률분포
- t-분포
- 모평균을 추론함에 모준산이 알려지지 않은 경우, 소규모의 표본에서 사용
- 정규분포에 비해 두꺼운 꼬리
- 자유도가 증가할수록 표준정규분포에 근사
- \chi^2 -분포
- 모분산 추론에 유용
- right skewed
- Z_1^2 + Z_2^2 + \dots + Z_k^2 \sim \chi_(k)^2
- F-분포
- 두 정규모집단의 분산 비교에 대한 추론
- 확률변수 F 가 자유도 (k_1, k_2) 를 따를 때 : \frac{1}{F} \sim F_{(k_1, k_2)}
- F_{k_2, k_1 ; 1- \alpha} = \frac{1}{F_{(k_1, k_2 ; \alpha)}}
- 두 정규모집단에서의 표본분산의 비에 대한 분포: \frac{\sigma_2^2}{\sigma_1^2} \cdot \frac{S_1^2}{S_2^2} \sim F_{(n_1 -1, n_2 -1)}
3. 표본분포
- 평균의 표본분포 - 모집단이 정규분포이면서 모분산을 알고 있거나 표본의 크기가 큰 경우 표본평균의 확률분포도 정규분포를 따른다.
- 비율의 표본분포
- 표본비율의 정규근사: \hat{p} \sim N \left(p, \frac{p(1-p)}{n} \right)
- 모집단 비율이 p = 0.5 가 아니어도 np \geq 5, nq \geq 5 일 때, 정규분포에 근사
'STATISTICS > 사회조사분석사' 카테고리의 다른 글
3-4. 통계분석 (0) | 2020.09.17 |
---|---|
3-3. 통계적 추정 및 가설검정 (0) | 2020.09.13 |
3-1. 통계학 개요 (0) | 2020.09.13 |
2-3. 척도 (0) | 2020.09.12 |
2-2. 측정 (0) | 2020.09.11 |