AI 시대를 표류하는 모든 위버맨쉬에게 이 글을 바…..칠 정도의
멋진 글들을 쓸 수 있는 날이 오길 바라며
– 오류에 대한 정정, 의견, 그 외 건의 사항 등 언제나 환영입니다 –
들어가기 앞서…
특정 이차 자료원을 이용한 역학 연구를 설계하여 제안해 달라는 요청을 받았다.
그런데 문제는 아직 아무것도 모른다…? (털썩)
Q. 역학(epidemiology)이 뭐지?
A. 다양한 정의가 머나먼 옛날부터 있어 왔으나,
그 핵심과 맥락을 취합해보니 “인간사회 집단”을 대상으로, “질병의 발생, 분포 및 경향과 양상”을 다루며, “그 원인을 탐구” 하는 것으로 정리할 수 있겠음.
일반적인 의학 연구와 구분하자면
1. 대상이 건강인을 포함한 인구 집단
2. 지역 사회의 규모 및 건강수준(거시적)을 지표로 활용하며
3. 질병의 빈도와 분포를 파악하며
4. 건강에 영향을 미치는 다양한 요인과 질환의 상관관계를 연구하는 것으로 말할 수도 있겠다.
Q. 그렇다면 역학 연구는 어떻게 수행하는가?
- 적절한 데이터를 구할 수 있나?
- ‘요인’과 ‘질병’ 간에 어떠한 경향성(관련성) 이 있는지를 파악하라.
- 2번에서 발견된 관련성에서 무작위 오류(우연)에 의한 것과 바이어스(교란변수, 비통계적 연관성)를 배제하라
- 위험요인과 예방요인
- 높은 상관관계를 가지는 요인과 질병간의 인과관계가 앞뒤가 맞는지 확인(인과 추론, causal inference)
- 필요충분, 시간적 선후관계, 연관강도(odd ratio?), 일관성, 특이성, 용량 반응관계, 선행연구와 일치, 생물학적 스토리를 따질 수 있음
그렇다면 나는?
순서 1. 경향성이 있는지를 파악하자
- 접근 가능한 요인(문진, demographic)중 일부를 선별해서 타겟 질환 유무로 유의성 검정(범주형)
순서 2. 유의하게 나온 애들 중에 우연과 바이어스 통제
- 선택바이어스, 정보바이어스는 일단 고려하지 않음(제공되는 자료원 전수 사용)
- 데이터를 뜯어보고 바이어스가 있다면 배제 방법론 수립
- 교란바이어스에 대해서 타겟 질환에 대한 선행조사를 토대로 가능한 교란변수 candidate 확정하고 이를 분석 단계에서 검증
- **무작위 오류는 어떻게 배제하지?** (공부해서 추후 업데이트 예정)
순서 3. 걸러진 candidate 들이 실제로 인과관계가 성립하는지를 최종 검증!
- 인과성 검증(회귀분석?)
- 대조군을 설정하여 연관강도 비교(odd ratio?)
- 일관성과 특이성을 볼 수 있는 데이터셋인지 확인하기
- 용량 반응 관계는 어려울 수도 있음(질환 유무 binary type)
- 관련 질환의 선행 지식과 생물학적 설명가능성 검토

댓글 남기기