-
<통계학> 통계적 가설 검정 -2 (신뢰수준, 1종 오류, 2종 오류)데이터 분석 관련 공부 2024. 1. 23. 14:13
귀무가설, 대립가설, 유의확률 및 유의수준에서 이어지는 내용이다.
앞서의 내용은 https://jinhyunbae.tistory.com/126 링크를 참조
<통계학> 통계적 가설 검정 -1 (귀무가설, 대립가설, p-value)
통계적 가설검정(statistical hypothesis)이란 통계적 추론의 하나로 모집단의 실제 값이 얼마가 된다는 주장과 관련해, 표본의 정보를 사용해서 가설의 합당성의 여부를 판정하는 과정을 의미한다(이
jinhyunbae.tistory.com
신뢰 수준과 신뢰 구간
신뢰수준 (Confidence Level)
일반적으로 p-value가 연구를 시작할 때 세운 기준 수치보다 작으면 귀무가설이 틀렸다고 판단하여 기각하게 되는데
이러한 기준이 되는 수치를 신뢰 수준 혹은 신뢰도라고 한다.
그러면 유의수준과의 차이는 무엇인가?
신뢰수준은 검정하려는 귀무가설이 참일 때 이를 옳다고 판단하는 확률이다.
유의수준은 검정하려는 귀무가설이 거짓일 때 이를 옳다고 판단하는 확률이다.
따라서 유의수준 α = 0.05라면 신뢰수준은 1 - α = 0.95인 것이다.
그렇다면 신뢰구간은 또 무엇인가?
신뢰 구간(Confidence Interval)
특정 범위 내에 모수의 값이 존재할 것으로 예측되는 영역
점 추정은 미지의 모수에 대해서 단 하나의 값으로 추정을 한다. 그렇기 때문에 추정값이 옳을 확률은 1아니면 0이다.
따라서 좋은 추정방법을 사용해도 표본으로 부터 계산된 추정 값이 목표값을 잘 추정한다고 주장하기 어렵다
이를 해결하기 위해서 구간추정이 사용된다.
구간 추정은 하나의 수치를 구하는 것이 아니라 추정량의 분포를 이용하여 표본으로부터 모수값을 포함하리라 예상되는 구간을 제시한다. 이 때 제시되는 구간이 신뢰구간인 것이다.
따라서 구간 추정은 신뢰구간을 추정하는 작업이라고 할 수 있다.
신뢰구간을 추정할 때는 상황에 따라 다른 확률분포를 사용하고, 신뢰구간 내에 모집단의 실제 값이 포함될 확률을 신뢰수준이라고 부른다.
출처 : https://blog.naver.com/PostView.naver?blogId=iotsensor&logNo=222182891116 1종 오류와 2종 오류
출처 : Scribbr 통계적 가설검정에서의 오류는 크게 1종오류, 2종 오류 2가지로 나뉜다.
1종 오류(Type I Error)
귀무가설이 참인데 귀무가설을 기각하는 오류(α)로 유의수준과 같은 말이다.
예를 들어 설명하면 신약이 효과가 없음에도 불구하고 신약이 효과가 있다고 판단하는 경우를 말할 수 있다.
2종 오류(Type II Error)
귀무가설이 거짓인데 귀무가설을 기각하지 않는 오류 (β)
예를 들어 실제로는 신약이 효과가 있음에도 불구하고 효과가 없다라고 판단하는 경우를 예로 들 수 있다.
검정력(Statistical Power)
대립가설이 참일 때 귀무가설을 기각할 확률 대립 가설을 채택할 확률(1-β)
그래프를 통해서 보자
그래프에서 임계치(Threshold)는 α, β에 대한 값의 정해진 기준이다.
신뢰수준이 올라갈수록 1종 오류는 줄어들게 된다.
유의수준이 낮아질수록 신뢰수준은 올라간다 다시 말해 유의수준이 낮아지면 1종 오류는 줄어들게 된다.
그런데 동시에 신뢰수준이 올라가게 되면 검정력은 줄어들게 된다.
다시 말해서 1종 오류의 확률을 줄이면 2종 오류가 커지는 Trade off가 발생한다
위 그래프에서 보자면 임계치 값이 두 그래프가 겹친 부분의 중앙 쯤으로 가는게 Trade off 상태에서 두 오류를 줄일 수 있는 최고의 상태가 된다.
하지만 상황에 따라서 어떤 오류가 더 중요한지는 달라질 수 있다. 일반적으로 통계학은 1종 오류를 더 중요하게 생각하여 1종 오류를 기준으로 잡은 상태에서 2종 오류를 줄이려고 한다.
Refercences
- https://blog.naver.com/PostView.naver?blogId=iotsensor&logNo=222182891116
- https://drhongdatanote.tistory.com/76
- https://blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=uranusjj&logNo=221610312776
Ⅵ. 통계적 추론(신뢰구간과 표본크기)
1. 개념 실제 우리의 일상생활에서 학문적 연구에서 모집단의 성격을 모르는 상황에서 모집단의 성격을 규...
blog.naver.com
[개념 통계 19] 1종 오류와 2종 오류란 무엇인가
안녕하세요. 이번 포스팅에서는 통계적 오류에 대해서 이야기해 보겠습니다. 우리는 수집한 데이터를 바탕으로 어떠한 사안에 대해서 결정을 합니다. 하지만 우리가 항상 옳은 결정을 하는 것
drhongdatanote.tistory.com
1종오류, 2종오류, 검증력
* 검증력으로 높이기 위한 방법 3가지 ① 유의수준을 높힌다 (신뢰수준을 낮춘다) ② 표본의 크기를 키운다...
blog.naver.com
'데이터 분석 관련 공부' 카테고리의 다른 글
<통계학> t검정(t-test) - 2 (with Python) (0) 2024.01.24 <통계학> t검정(t-test) - 1 (1) 2024.01.23 <통계학> 통계적 가설 검정 -1 (귀무가설, 대립가설, p-value) (1) 2024.01.22 <통계학> 큰 수의 법칙, 중심극한정리 (1) 2024.01.22 <Python, SQL> pymysql 라이브러리(with Pandas DataFrame) (0) 2024.01.12