1. 이산확률분포
- 이항분포 binomial distribution
- 베르누이 시행: 사건의 결과가 상호 배타적인 두 개 뿐인 시행
- $P(X=x) = _nC_x p^x q^{n-x} ={n \choose x} p^x q^{n-x} ; x = 0, 1, 2, \dots, n$
- 평균: $E(X) = np$
- 분산: $V(X) = npq = np(1-p)$
- $p=0.5 $ 이면 기댓값에 대해 좌우대칭
- $np \geq 5, nq \geq 5$ 일 때, 정규분포에 근사
- $p \leq 0.1, n \geq 50$ 일 때, 푸아송분포에 근사
- 푸아송분포 poisson distribution
- 고정된 시간이나 공간에서 일어나기 드문 사건을 설명
- $P(X=x) = \frac{e^{- \lambda} \lambda^x}{x !} ; x = 0, 1, 2, \dots, n, \lambda = $ 단위시간 당 평균 발생횟수
- 평균: $E(X) = \lambda$
- 분산: $V(X) = \lambda$
- 초기하분포 hypergeometric distribution
- 매 시행마다 성공확률이 일정하지 않을 때, 매 시행이 종속적(비복원추출)일 경우
- 모딥단의 크기가 충분히 크고, $\frac{m}{N} = P $ 로 일정한 경우 이항분포로 근사
- $P(X=x) = \frac{{m \choose x}{{N-m} \choose {n-x}}}{{N \choose n}} ; x = 0, 1, 2, \dots, ,min(m, n)$
- 평균: $E(X) = np$
- 분산: $V(X) = \frac{N - n}{N -1} np(1-p), p =\frac{m}{N}$
- 기하분포 geometric distribution
- $P(X=x) =p(1-p)^{x-1}$
- 평균: $E(X) =\frac{1}{p}$
- 분산: $V(X) = \frac{1-p}{p^2}$
2. 연속확률분포
- t-분포
- 모평균을 추론함에 모준산이 알려지지 않은 경우, 소규모의 표본에서 사용
- 정규분포에 비해 두꺼운 꼬리
- 자유도가 증가할수록 표준정규분포에 근사
- $\chi^2$ -분포
- 모분산 추론에 유용
- right skewed
- $Z_1^2 + Z_2^2 + \dots + Z_k^2 \sim \chi_(k)^2$
- F-분포
- 두 정규모집단의 분산 비교에 대한 추론
- 확률변수 $F$ 가 자유도 $(k_1, k_2)$ 를 따를 때 : $\frac{1}{F} \sim F_{(k_1, k_2)}$
- $F_{k_2, k_1 ; 1- \alpha} = \frac{1}{F_{(k_1, k_2 ; \alpha)}}$
- 두 정규모집단에서의 표본분산의 비에 대한 분포: $ \frac{\sigma_2^2}{\sigma_1^2} \cdot \frac{S_1^2}{S_2^2} \sim F_{(n_1 -1, n_2 -1)} $
3. 표본분포
- 평균의 표본분포 - 모집단이 정규분포이면서 모분산을 알고 있거나 표본의 크기가 큰 경우 표본평균의 확률분포도 정규분포를 따른다.
- 비율의 표본분포
- 표본비율의 정규근사: $\hat{p} \sim N \left(p, \frac{p(1-p)}{n} \right)$
- 모집단 비율이 $p = 0.5$ 가 아니어도 $np \geq 5, nq \geq 5$ 일 때, 정규분포에 근사
'STATISTICS > 사회조사분석사' 카테고리의 다른 글
3-4. 통계분석 (0) | 2020.09.17 |
---|---|
3-3. 통계적 추정 및 가설검정 (0) | 2020.09.13 |
3-1. 통계학 개요 (0) | 2020.09.13 |
2-3. 척도 (0) | 2020.09.12 |
2-2. 측정 (0) | 2020.09.11 |