Processing math: 0%
본문 바로가기

STATISTICS/사회조사분석사

3-2. 확률분포

1. 이산확률분포

  • 이항분포 binomial distribution
    • 베르누이 시행: 사건의 결과가 상호 배타적인 두 개 뿐인 시행
    • P(X=x) = _nC_x p^x q^{n-x} ={n \choose x} p^x q^{n-x} ; x = 0, 1, 2, \dots, n 
    • 평균: E(X) = np
    • 분산: V(X) = npq = np(1-p) 
    • p=0.5 이면 기댓값에 대해 좌우대칭
    • np \geq 5, nq \geq 5 일 때, 정규분포에 근사
    • p \leq 0.1, n \geq 50 일 때, 푸아송분포에 근사
  • 푸아송분포 poisson distribution
    • 고정된 시간이나 공간에서 일어나기 드문 사건을 설명
    • P(X=x) = \frac{e^{- \lambda} \lambda^x}{x !} ; x = 0, 1, 2, \dots, n,   \lambda = 단위시간 당 평균 발생횟수
    • 평균: E(X) = \lambda
    • 분산: V(X) = \lambda
  • 초기하분포 hypergeometric distribution
    • 매 시행마다 성공확률이 일정하지 않을 때, 매 시행이 종속적(비복원추출)일 경우 
    • 모딥단의 크기가 충분히 크고, \frac{m}{N} = P 로 일정한 경우 이항분포로 근사
    • P(X=x) = \frac{{m \choose x}{{N-m} \choose {n-x}}}{{N \choose n}} ; x = 0, 1, 2, \dots, ,min(m, n)
    • 평균: E(X) = np
    • 분산: V(X) = \frac{N - n}{N -1} np(1-p), p =\frac{m}{N}
  • 기하분포 geometric distribution
    • P(X=x) =p(1-p)^{x-1}
    • 평균: E(X) =\frac{1}{p}
    • 분산: V(X) = \frac{1-p}{p^2}

2. 연속확률분포

  • t-분포
    • 모평균을 추론함에 모준산이 알려지지 않은 경우, 소규모의 표본에서 사용
    • 정규분포에 비해 두꺼운 꼬리
    • 자유도가 증가할수록 표준정규분포에 근사
  • \chi^2 -분포
    • 모분산 추론에 유용
    • right skewed
    • Z_1^2 + Z_2^2 + \dots + Z_k^2 \sim  \chi_(k)^2
  • F-분포
    • 두 정규모집단의 분산 비교에 대한 추론
    • 확률변수 F 가 자유도 (k_1, k_2) 를 따를 때 : \frac{1}{F} \sim F_{(k_1, k_2)}
    • F_{k_2, k_1 ; 1- \alpha} = \frac{1}{F_{(k_1, k_2 ; \alpha)}}
    • 두 정규모집단에서의 표본분산의 비에 대한 분포: \frac{\sigma_2^2}{\sigma_1^2} \cdot \frac{S_1^2}{S_2^2} \sim F_{(n_1 -1, n_2 -1)} 

3. 표본분포

  • 평균의 표본분포 - 모집단이 정규분포이면서 모분산을 알고 있거나 표본의 크기가 큰 경우 표본평균의 확률분포도 정규분포를 따른다.
  • 비율의 표본분포
    • 표본비율의 정규근사: \hat{p}  \sim N \left(p, \frac{p(1-p)}{n} \right)
    • 모집단 비율이 p = 0.5 가 아니어도 np \geq 5, nq \geq 5 일 때, 정규분포에 근사

 

'STATISTICS > 사회조사분석사' 카테고리의 다른 글

3-4. 통계분석  (0) 2020.09.17
3-3. 통계적 추정 및 가설검정  (0) 2020.09.13
3-1. 통계학 개요  (0) 2020.09.13
2-3. 척도  (0) 2020.09.12
2-2. 측정  (0) 2020.09.11