본문 바로가기

STATISTICS/사회조사분석사

3-2. 확률분포

1. 이산확률분포

  • 이항분포 binomial distribution
    • 베르누이 시행: 사건의 결과가 상호 배타적인 두 개 뿐인 시행
    • $P(X=x) = _nC_x p^x q^{n-x} ={n \choose x} p^x q^{n-x} ; x = 0, 1, 2, \dots, n$ 
    • 평균: $E(X) = np$
    • 분산: $V(X) = npq = np(1-p)$ 
    • $p=0.5 $ 이면 기댓값에 대해 좌우대칭
    • $np \geq 5, nq \geq 5$ 일 때, 정규분포에 근사
    • $p \leq 0.1, n \geq 50$ 일 때, 푸아송분포에 근사
  • 푸아송분포 poisson distribution
    • 고정된 시간이나 공간에서 일어나기 드문 사건을 설명
    • $P(X=x) = \frac{e^{- \lambda} \lambda^x}{x !} ; x = 0, 1, 2, \dots, n,   \lambda = $ 단위시간 당 평균 발생횟수
    • 평균: $E(X) = \lambda$
    • 분산: $V(X) = \lambda$
  • 초기하분포 hypergeometric distribution
    • 매 시행마다 성공확률이 일정하지 않을 때, 매 시행이 종속적(비복원추출)일 경우 
    • 모딥단의 크기가 충분히 크고, $\frac{m}{N} = P $ 로 일정한 경우 이항분포로 근사
    • $P(X=x) = \frac{{m \choose x}{{N-m} \choose {n-x}}}{{N \choose n}} ; x = 0, 1, 2, \dots, ,min(m, n)$
    • 평균: $E(X) = np$
    • 분산: $V(X) = \frac{N - n}{N -1} np(1-p), p =\frac{m}{N}$
  • 기하분포 geometric distribution
    • $P(X=x) =p(1-p)^{x-1}$
    • 평균: $E(X) =\frac{1}{p}$
    • 분산: $V(X) = \frac{1-p}{p^2}$

2. 연속확률분포

  • t-분포
    • 모평균을 추론함에 모준산이 알려지지 않은 경우, 소규모의 표본에서 사용
    • 정규분포에 비해 두꺼운 꼬리
    • 자유도가 증가할수록 표준정규분포에 근사
  • $\chi^2$ -분포
    • 모분산 추론에 유용
    • right skewed
    • $Z_1^2 + Z_2^2 + \dots + Z_k^2 \sim  \chi_(k)^2$
  • F-분포
    • 두 정규모집단의 분산 비교에 대한 추론
    • 확률변수 $F$ 가 자유도 $(k_1, k_2)$ 를 따를 때 : $\frac{1}{F} \sim F_{(k_1, k_2)}$
    • $F_{k_2, k_1 ; 1- \alpha} = \frac{1}{F_{(k_1, k_2 ; \alpha)}}$
    • 두 정규모집단에서의 표본분산의 비에 대한 분포: $ \frac{\sigma_2^2}{\sigma_1^2} \cdot \frac{S_1^2}{S_2^2} \sim F_{(n_1 -1, n_2 -1)}  $

3. 표본분포

  • 평균의 표본분포 - 모집단이 정규분포이면서 모분산을 알고 있거나 표본의 크기가 큰 경우 표본평균의 확률분포도 정규분포를 따른다.
  • 비율의 표본분포
    • 표본비율의 정규근사: $\hat{p}  \sim N \left(p, \frac{p(1-p)}{n} \right)$
    • 모집단 비율이 $p = 0.5$ 가 아니어도 $np \geq 5, nq \geq 5$ 일 때, 정규분포에 근사

 

'STATISTICS > 사회조사분석사' 카테고리의 다른 글

3-4. 통계분석  (0) 2020.09.17
3-3. 통계적 추정 및 가설검정  (0) 2020.09.13
3-1. 통계학 개요  (0) 2020.09.13
2-3. 척도  (0) 2020.09.12
2-2. 측정  (0) 2020.09.11