말이 통하려면 알아야 하는 것
- FDR: False Discovery Rate, 말 그대로 ‘False를 선택하는 비중’인데,
이를 조금 더 쉽게 풀어서 써보자면 ‘다중 검정’ 에서 ‘유의미하다고 잘못 평가된 검정’ 의 비율을 전체 ‘유의미한 검정’ 대비 일정 이하로 통제하겠다는 말이다.
(여전히 어려워 보인다…)
예를 들어 FDR 을 0.05로 통제하겠다는 말은, 일반 통계 검정에서 쓰는 p-value 가 0.05 이하로 나온 전체 요인 중에
- 귀무가설: null hypothesis. 새로운 치료법은 효과가 없고 차이도 없다.
“다른 상황을 생각하게 하는 현저한 근거가 없는 한 현상적인 모든 차이는 0(무) 이다” 는 이 명제로부터 모든 통계 분석이 출발한다.
p < 0.01이라는 의미는 귀무가설이 참이라면 이 결과가 나올 확률이 1% 보다 낮다는 의미이다. 즉 귀무가설이 거짓이다. 즉! 새로운 효과법은 효과가 있을 확률이 99% 보다 높다고 말할 수 있는 것이다.(그리고 이게 바로 대립가설이다.) - 대립가설: 위의 설명과 함께 이해하기.
- 회귀분석: 두 변수 사이의 검정을 하면 연관관계가 나오는거지 인과관계가 나오는건 아니다! > 그 때 두 변수 사이의 인과를 밝히는 분석을 말함.
이 때 투입되는 변수는 공변량(연속일때)이나 요인(범주형일때) 로 부르기도 함.
- 우위성 검정: 카이 제곱 검정, 대조군에 비해 비교군이 더 많은 비율로 좋아진 경우(ex. 약물에 더 많이 반응하는 경우)
- 동등성 검정: **이거 어렵다** 동등성 검정이라는 말을 쓰려면 흔히 아는 것 처럼 ‘귀무가설:효과가 없다, 대립가설:효과가 있다’ 의 반대로 설정이 되어야 한다.
(ex. 귀무가설: 두 치료법은 효과의 차이가 있다.)- 왜? 귀무가설을 기각하지 못한다고 해서 귀무가설이 항상 참인 것은 아니기 때문이다. (ex. p-value = 0.2 이면 귀무가설이 참이라면 이 결과가 나올 확률이 20% 라는 얘기다. 애매~ 하지?)
- 그렇기 때문에 그룹간의 ‘동등성’ 을 검정하기 위해서는 두 그룹간의 효과가 ‘차이가 있다‘ 를 귀무가설로 놓고 충분히 낮은 p value 로 귀무가설을 기각시켜서 ‘두 그룹간에 차이가 없다’ 는 대립가설을 채택하는 각으로 가야 한다.
- 제 1종 오류(alpha): 실제로는 효과가 없는데 “효과가 있다고 잘못 나오는 오류“
결과가 적용되었을 때의 문제의 심각도가 높기 때문에 가장 문제가 되는 오류(0.05 미만으로 통제하는 것이 기본) - 제 2종 오류(beta): 실제로는 효과가 있지만 “효과가 없다고 잘못 나오는 오류“.
1-beta 를 “검정력(power)” 라고 따로 부르고 통계 기법이나 설계가 얼마나 좋은지를 따지는 척도로 사용함. (power = 실제 효과가 있는 것을 효과가 있다고 증명할 수 있는 (도구나 설계의)능력!)
![[통계실전] 1. FDR 분석](https://overman.blog/wp-content/uploads/2025/03/0b92d-pexels-andreea-ch-371539-3371410.jpg?w=800)
댓글 남기기