ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 통계적 가설 검정
    practice_선형대수 2024. 10. 1. 11:44
    Q. 통계적 가설 검정(Hypothesis Testing)의 기본 과정과 주요 개념에 대해 설명 해 주세요.

     

    A. 가설 검정은 가설이 데이터에(실험결과) 적합한지를 검토하는 과정입니다.
    먼저 귀무가설과 대립가설 설정을 하고
    귀무가설은 효과가 없다고 가설설정하고, 반대로 대립가설은 효과가 있다고 가정
     
    실험을 진행하고, 실험결과와 귀무가설이 얼마나 일치하는지 분석했는데
    만약 귀무가설이 실험결과와 일치할확률이  5%이하면, 귀무가설을 기각하고, (항상 귀무가설이 참인것으로 설정하고 시작)
    대립가설을 참인것으로 (95%이상) 결론을 내림.
     
    귀무가설과 대립가설 설정    -> 동전은 조작되지 않았다. VS 조작되었다.

    - 검정 통계량 계산                  ->  조작되지 않은 동전의 확률계산

    - p-값을 통한 가설 검정 결과 해석이   -> 의심되는 동전으로 실험후 확률사용해(비교해서) 결론

     

     

     

     

    귀무가설과 대립가설

     

    가설 검정은 가설이 데이터에 적합한지를 검토하는 과정입니다.

     

    일반적으로, 연구에서는 검증해야 할 가설이 존재하며, 연구자들은 실험을 통해 가설을 증명하려고 한다
    하지만 단순히 실험 결과가 나왔다고 해서 자동적으로 가설이 증명되는 것은 아니다
    주어진 실험 결과를 토대로 통계적으로 가설을 검증할 필요가 있다

     

    연구자들은 일반적으로 귀무가설 (Null hypothesis)과 대립가설 (Alternative hypothesis)을 만들고, 이를 통해 통계적으로 실험 결과를 분석한다
    귀무가설은 연구자들이 틀렸다는 것을 증명 하려는 가설이며, 일반적으로 제안된 방법이 효과가 없거나, 유의미한 개선이 없다고 가정하는 것이다
    반대로, 대립가설은 제안된 방법이 유의미한 개선을 만든다고 가정하는 것이다.
     
    만약 실험을 통해 귀무가설이 틀렸다는 것이 증명될 경우, 자동적으로 대립가설이 참이 된다
     
    예를 들자면, 어떤 연구에서 신약 A의 효능을 증명하려 한다
     
    이때 귀무가설은 신약 A는 효능이 없다
    반대로 대립가설은 신약 A는 유의미한 효과가 있다
     
    실험을 통해 귀무가설이 틀린 것을 증명하는 것이 목표

     

     

    하지만 어떻게 귀무가설이 틀린 것을 증명할 수 있을까?
    통계적인 분석을 통해, 귀무가설이 맞을 확률이 5% (이유없음-관례적)이하면, 귀무가설을 기각하자
    굳이 5%?
    딱히 통계적인 이유가 있는건 아니고, 처음 이러한 방법론을 제안한 사람 (Fisher)5%를 사용했고, 이게 그냥 관례적으로 내려오는 것
    확률을 p(p value)라고 한다
    P값을 0.5%로 내려야 한다는 의견 또한 존재
    예) 신약 20개중 --> 사실 다 효과가 없음
     실제로는 효과가 없더라도, 이들중 하나는 효과가 있는것으로 잘못된 결론이 나올수 있음.
     
    귀무가설이 맞을 확률이 5% 이하면, 귀무가설 기각
    -> 5%의 확률로, 귀무가설이 맞는데도 기각할수 없음
     

     

     

    연구 예시
     

    어떠한 동전 C가 주어졌다. 이때 연구자들은 이 동전이 조작되었음을 밝히려 한다 (앞면이 나올 확률이 훨씬 높다

     

    1.귀무 가설: 주어진 동전은 조작되지 않았다 (앞면과 뒷면이 나올 확률은 50%로 동일하다)
    2.대립가설: 주어진 동전은 조작되었다 (앞 뒷면의 확률이 50%로 동일하지 않다)
    이때 귀무 가설을 어떻게 5%의 확률로 기각할 수 있을까?
     
    1.동전 던지기는 이항 분포를 따른다
    2.이항 분포를 통해, (만약 동전이 정상이라면) 앞면이 나올 횟수와 확률을 예측할 수 있다

     

    아래그림 (조작되지 않을때)

    이항 분포에 따르면, 정상적인 동전을 21번 던졌을 때, 앞면이 17번 나올 확률은 거의 0에 가깝다 (5%보다 훨씬 낮음)
    정상적인 동전 던졌을때 앞면이 17번 나올 확률은 0%에 가까움
    반대로
    조작된 것으로 의심되는 동전을 21번 던졌는데 앞면이 17번 나옴
    -> 매우 높은 확률로 동전은 조작되었다. 
     
    ------------------------------------------------------------
    정상적인 동전 던졌을때 앞면이 14번 나올 확률은 5.3%에 가까움
    반대로
    조작된 것으로 의심되는 동전을 21번 던졌는데 앞면이 14번 나옴
    -> 의심스럽지만 조작되었다고 결론 내릴수는 없다.
     

     

    결론

    연구목표: 의심스러운 동전이, 진짜 조작되었는지를 알아보자

                           

    귀무가설: 동전은 조작되지 않았다.   대립가설: 동전은 조작되었다.

    귀무가설이 맞을 확률이 10% --> 대립가설이 맞을 확률 90%  (왜냐하면 대립가설이 95%이상이어야만 참인거같다)

       ->기각안됨 5%이하안되지만 여전히 대립가설이 90%라서 동전은 조작되었을거라 의심스럽지만 결론을 내릴수없다. 

Designed by Tistory.