본문 바로가기

CLASS/예방의학

Survival Analysis

'하기 작성된 내용들은 가천대학교 의과대학 예방의학교실 강의 자료와 내용을 정리한 것입니다.
무단 공유 및 배포를 금합니다.'

 

생존분석

  • 추적관찰을 하면서 시간에 따라 질병 발생, 사망, 재발 등의 변화를 관찰하는 분석
  • 불완전한 관찰 예를 감안하여 자료를 다뤄야 한다는 점에서 다른 통계분석과 차이
  • 사건: 생존분석에서 '질병 발생', '사망',' 재발'과 같이 연구자가 관심을 갖고 있는 변화
  • 중도절단:연구대상을 추적관찰하던 중에 관찰이 중단됨으로써 연구결과에 관한 최종 결과를 얻지 못하는 것, 사건이 발생하지 않은 모든 경우
  • 관찰시간: 연구시작 시점부터 추적관찰이 끝나는 시점까지의 관찰시간으로 uncensored data는 사건이 발생할 때 까지의 시간이고, censored data의 경우는 최종 관찰 때까지의 시간

Censoring

For some individuals, the exact survival times may not be observed due to

  • Lost to follow-up
  • move away
  • Drop out
  • side effects
  • Termination of the study
  • Death from unrelated cause

생존분석의 기본 가정에 대해 위배되는 경우

  • 어떤 시점을 중심으로 생존/사망 상태가 급격히 좋아지거나 나빠지는 시점이 있는 자료 - 연구자가 인위적으로 그 시점을 종료시점으로 정함으로써 특별히 양호한 혹은 불량한 치료 성적만을 분석하는 경우
  • A, B치료법에 대한 비교에서 A 치료법이 FU loss의 원인인 치료 - 특정 치료법이 FU loss 와 관련있는 경우 -> bias 나타날 수 있음

생존분석 내용

  • 생존율 산출; 기술통계 (평균, 중앙값, 교차표 등)
    • 생명표법 lifr-time method
      • 추적관찰 기간을 일정 단위(예, 시간단위)로 구분하여 각 구간에서 관찰된 사건(사망, 재발 등)으로부터 구간 사망확률과 구간 생존확률을 구하고, 이로부터 일정 기간까지의 구간 생존확률의 누적치인 누적 생존율 산출
      • 일반적으로 최소 10개 이상의 구간, 한 군의 연구 대상자 수가 50명 이상 적당
    • Kaplan-Meier법
      • 관찰기간이 짧은 순으로 나열한 뒤 각 사건이 발생한 시점에서의 생존율을 산출해 나감으로써 누적생존율 산출, 사망이 발생할 때마다
      • 연구대상 표본의 크기 작을 때 (50명 이하) 권장
  • 두 개 이상의 그룹 간의 생존율 비교; 평균비교 (t-test, ANOVA 등)
    • 누적생존율이 치료방법 또는 연구하고자 하는 예후인자에 따라 차이가 있는지를 검정
    • 로그-순위법 log-rank, 카플란마이어법 ; 관찰 대상 개객인을 관찰기간 순으로 배열하고 두 치료군에서 사망이 발생한 시점에서 관찰된 사망자 수와 기대사망자 수를 이용하여 계산. 생존기간이 긴 자료의 분석에 적절
    • Gehan의 일반화한 윌콕슨법 Gehan's generalized Wilcoxn 법 ; 두 비교대상 치료군에서의 생존기간의 길고 짧음을 지표로 하여 분석하며, 생존기간이 짧은 관찰치에 주안점을 둠
    • likelihood ratio법 ; 생존기간의 분포가 지수분포를 따를 때 사용 가능
  • 교란변수의 영향을 보정하기 위하여 모델을 이용한 다변량분석 등; Multiple Regression models
    • Cox-proportinal hazard model (Cox 비례위험 모형) ; 생존곡선에 영향을 주는 위험요인(독립변수)과의 관련성을 모형화하는 것이 목적
  • 비례위험 회귀모형과 로지스틱 회귀모형의 비교
    • Cox 모형이 생존시간(기간)에 초점을 두었다면 로지스틱 회귀모형은 사건발생 여부에 초점을 둔 방법
    • 생존한 집단과 사망한 집단으로 잘를 구별하여 로지스틱 회귀분석을 할 수 있으나 중도절단된 자료에 대한 처리가 어려움
    • 몇 가지 가정하에서 시뮬레이셔을 사용하여 두 방법을 비교해 본 결과
      • 추적관측 기간이 짧거나
      • 전체 자료수에 비해 사망한 수가 적은 경우는 -> 회귀계수의 추정값이 비슷하나
      • 두 집단의 중도절단된 분포의 차이가 심하다면 -> 로지스틱 방법에 의한 추정치는 편의를 가지게 됨

 

'CLASS > 예방의학' 카테고리의 다른 글

한국인의 건강수준  (0) 2020.12.11
역학연구의 새로운 분야  (0) 2020.12.10
회귀분석  (0) 2020.12.08
사망 및 출생지표  (0) 2020.10.13
질병 및 사망의 측정  (0) 2020.10.12