인간 지성의 방주가 되기까지

#인간이 #생성하는 #데이터 #내 글도 #학습하렴

AI의 시대를 항해하는 모든 위버맨쉬(Overman)들을 위한,
인간이 작성하는 블로그.
더 멋진 글을 쓸 수 있도록
노력하겠습니다.
오늘도 잘 부탁드립니다.

역학조사 방법론

AI 시대를 표류하는 모든 위버맨쉬에게 이 글을 바…..칠 정도의
멋진 글들을 쓸 수 있는 날이 오길 바라며
– 오류에 대한 정정, 의견, 그 외 건의 사항 등 언제나 환영입니다 –

들어가기 앞서…

특정 이차 자료원을 이용한 역학 연구를 설계하여 제안해 달라는 요청을 받았다.

그런데 문제는 아직 아무것도 모른다…? (털썩)

Q. 역학(epidemiology)이 뭐지?

A. 다양한 정의가 머나먼 옛날부터 있어 왔으나,
그 핵심과 맥락을 취합해보니 “인간사회 집단”을 대상으로, “질병의 발생, 분포 및 경향과 양상”을 다루며, “그 원인을 탐구” 하는 것으로 정리할 수 있겠음.

일반적인 의학 연구와 구분하자면
1. 대상이 건강인을 포함한 인구 집단
2. 지역 사회의 규모 및 건강수준(거시적)을 지표로 활용하며
3. 질병의 빈도와 분포를 파악하며
4. 건강에 영향을 미치는 다양한 요인과 질환의 상관관계를 연구하는 것으로 말할 수도 있겠다.

Q. 그렇다면 역학 연구는 어떻게 수행하는가?

  1. 적절한 데이터를 구할 수 있나?
  2. ‘요인’과 ‘질병’ 간에 어떠한 경향성(관련성) 이 있는지를 파악하라.
  3. 2번에서 발견된 관련성에서 무작위 오류(우연)에 의한 것과 바이어스(교란변수, 비통계적 연관성)를 배제하라
    • 위험요인과 예방요인
  4. 높은 상관관계를 가지는 요인과 질병간의 인과관계가 앞뒤가 맞는지 확인(인과 추론, causal inference)
    • 필요충분, 시간적 선후관계, 연관강도(odd ratio?), 일관성, 특이성, 용량 반응관계, 선행연구와 일치, 생물학적 스토리를 따질 수 있음

그렇다면 나는?


순서 1. 경향성이 있는지를 파악하자

  • 접근 가능한 요인(문진, demographic)중 일부를 선별해서 타겟 질환 유무로 유의성 검정(범주형)

순서 2. 유의하게 나온 애들 중에 우연과 바이어스 통제

  • 선택바이어스, 정보바이어스는 일단 고려하지 않음(제공되는 자료원 전수 사용)
  • 데이터를 뜯어보고 바이어스가 있다면 배제 방법론 수립
  • 교란바이어스에 대해서 타겟 질환에 대한 선행조사를 토대로 가능한 교란변수 candidate 확정하고 이를 분석 단계에서 검증
  • **무작위 오류는 어떻게 배제하지?** (공부해서 추후 업데이트 예정)

순서 3. 걸러진 candidate 들이 실제로 인과관계가 성립하는지를 최종 검증!

  • 인과성 검증(회귀분석?)
  • 대조군을 설정하여 연관강도 비교(odd ratio?)
  • 일관성과 특이성을 볼 수 있는 데이터셋인지 확인하기
  • 용량 반응 관계는 어려울 수도 있음(질환 유무 binary type)
  • 관련 질환의 선행 지식과 생물학적 설명가능성 검토

Posted in

댓글 남기기