인간 지성의 방주가 되기까지

#인간이 #생성하는 #데이터 #내 글도 #학습하렴

AI의 시대를 항해하는 모든 위버맨쉬(Overman)들을 위한,
인간이 작성하는 블로그.
더 멋진 글을 쓸 수 있도록
노력하겠습니다.
오늘도 잘 부탁드립니다.

[통계학개론] 0. 이것도 헷갈리면 안된다

AI 시대를 표류하는 모든 위버맨쉬에게 이 글을 바…..칠 정도의
멋진 글들을 쓸 수 있는 날이 오길 바라며
– 오류에 대한 정정, 의견, 그 외 건의 사항 등 언제나 환영입니다 –

말이 통하려면 알아야 하는 것

  • 독립변수: 두 개의 변수가 있고, 이 변수가 다른 변수의 원인이 된다면 그 원인에 해당하는 것, 위험인자.
  • 종속변수: 결과가 되는 변수. 그래서 결과변수, 반응변수 라고 부름

  • 귀무가설: null hypothesis. 새로운 치료법은 효과가 없고 차이도 없다.
    “다른 상황을 생각하게 하는 현저한 근거가 없는 한 현상적인 모든 차이는 0(무) 이다” 는 이 명제로부터 모든 통계 분석이 출발한다.
    p < 0.01이라는 의미는 귀무가설이 참이라면 이 결과가 나올 확률이 1% 보다 낮다는 의미이다. 즉 귀무가설이 거짓이다. 즉! 새로운 효과법은 효과가 있을 확률이 99% 보다 높다고 말할 수 있는 것이다.(그리고 이게 바로 대립가설이다.)
  • 대립가설: 위의 설명과 함께 이해하기.

  • 회귀분석: 두 변수 사이의 검정을 하면 연관관계가 나오는거지 인과관계가 나오는건 아니다! > 그 때 두 변수 사이의 인과를 밝히는 분석을 말함.
    이 때 투입되는 변수는 공변량(연속일때)이나 요인(범주형일때) 로 부르기도 함.

  • 우위성 검정: 카이 제곱 검정, 대조군에 비해 비교군이 더 많은 비율로 좋아진 경우(ex. 약물에 더 많이 반응하는 경우)
  • 동등성 검정: **이거 어렵다** 동등성 검정이라는 말을 쓰려면 흔히 아는 것 처럼 ‘귀무가설:효과가 없다, 대립가설:효과가 있다’ 의 반대로 설정이 되어야 한다.
    (ex. 귀무가설: 두 치료법은 효과의 차이가 있다.)
    • 왜? 귀무가설을 기각하지 못한다고 해서 귀무가설이 항상 참인 것은 아니기 때문이다. (ex. p-value = 0.2 이면 귀무가설이 참이라면 이 결과가 나올 확률이 20% 라는 얘기다. 애매~ 하지?)
    • 그렇기 때문에 그룹간의 ‘동등성’ 을 검정하기 위해서는 두 그룹간의 효과가 ‘차이가 있다를 귀무가설로 놓고 충분히 낮은 p value 로 귀무가설을 기각시켜서 ‘두 그룹간에 차이가 없다’ 는 대립가설을 채택하는 각으로 가야 한다.

  • 제 1종 오류(alpha): 실제로는 효과가 없는데 “효과가 있다고 잘못 나오는 오류
    결과가 적용되었을 때의 문제의 심각도가 높기 때문에 가장 문제가 되는 오류(0.05 미만으로 통제하는 것이 기본)
  • 제 2종 오류(beta): 실제로는 효과가 있지만 “효과가 없다고 잘못 나오는 오류“.
    1-beta“검정력(power)” 라고 따로 부르고 통계 기법이나 설계가 얼마나 좋은지를 따지는 척도로 사용함. (power = 실제 효과가 있는 것을 효과가 있다고 증명할 수 있는 (도구나 설계의)능력!)

Posted in

댓글 남기기