C11 유의성의 의미 (271P)
# 단일표본 z검정
# 표본
n <- 36
x_bar <- 100
s <- 5
# 모집단
N <- 1000
mu <- 99
sigma <- 2.5
# 검정통계량
# 분자 = 표본평균 - 모평균
x_bar - mu
# 분모 = 표준오차 = 모표준편차/제곱근(n)
sigma/sqrt(n)
# 분자/분모
z <- (x_bar - mu)/(sigma/sqrt(n))
z
# 임계값(critical value), 양측검정, 유의수준 0.05
alpha <- 0.05
cv <- qnorm(1 - alpha/2)
cv
# 유의성 검정, 검정통계량과 임계값 비교
cv < z
# TRUE = 오른쪽 = 기각역 = 귀무가설 기각 = 연구가설 채택 = 차이가 있다 = 통계적으로 유의한 차이가 있다
#
# 유의성 검정, 유의확률과 유의수준 비교
alpha > (1 - pnorm(z))*2
# TRUE = 오른쪽 = 기각역 = 귀무가설 기각 = 연구가설 채택 = 차이가 있다 = 통계적으로 유의한 차이가 있다
#
x <- c(12,9,7,10,11,15,16,8,9,12)
mu <- 13
sigma <- 3
x_bar <- mean(x)
s <- sd(x)
n <- length(x)
x_bar;s;n
# 검정통계량 = (표본평균-모평균)/표준오차
# 분자 = 표본평균-모평균
x_bar - mu
# 분모 = 표준오차 = 표준편차/제곱근(n)
sigma/sqrt(n)
# 분자/분모
(x_bar - mu)/(sigma/sqrt(n))
z = abs((x_bar - mu)/(sigma/sqrt(n)))
z
# 축의 값을 면적으로 변환: pnorm()
# 면적을 축의 값으로 변환: qnorm()
# 임계값(critical value), 양측검정, 유의수준 0.05
alpha <- 0.05
cv <- qnorm(1 - alpha/2)
cv
# 유의성 검정, 검정통계량과 임계값 비교
cv < z
# TRUE = 오른쪽 = 기각역 = 귀무가설 기각 = 연구가설 채택 = 차이가 있다 = 통계적으로 유의한 차이가 있다
#
# 유의성 검정, 유의확률과 유의수준 비교
alpha > (1 - pnorm(z))*2
# TRUE = 오른쪽 = 기각역 = 귀무가설 기각 = 연구가설 채택 = 차이가 있다 = 통계적으로 유의한 차이가 있다
#
# z-test
# install.packages("BSDA")
library(BSDA)
z.test(x = x, mu = mu, sigma.x = sigma)
#
1) 유의성의 의미
- 통계적 유의성 : 통계에서 통계적 유의성은 결과나 변수 간의 관계가 우연히 발생했을 가능성을 의미합니다.
그리고 p-값이 미리 결정된 유의 수준(일반적으로 0.05) 미만이면 결과가 통계적으로 유의한 것으로 간주되며 효과 또는 관계가 없다는 귀무 가설을 기각합니다.
- 귀무가설 : 귀무 가설은 표본 데이터를 모집단과 비교하기 위한 기초를 제공하기 때문에 추론 통계의 중요한 부분입니다.
- 추론통계 : 샘플 데이터를 사용하여 더 큰 모집단에 대한 결론을 내리는 것과 관련이 있습니다.
2) 귀무가설에 통계적 검정을 적용하는 일반적인 단계 (유의성 검정)
- 귀무가설 공식화: 일반적으로 연구 중인 변수 사이에 유의미한 차이나 관계가 없음을 나타내는 검정하려는 가설입니다.
- 적절한 통계 테스트 결정: 보유한 데이터 유형과 답변하려는 연구 질문에 따라 다릅니다. 사용할 수 있는 다양한 통계 테스트가 있으며 데이터 및 연구 질문에 가장 적합한 것을 선택해야 합니다.
- 유의수준 설정: 귀무가설이 실제로 참일 때 귀무가설을 기각할 확률입니다. 일반적인 유의 수준은 0.05이며, 이는 귀무 가설이 실제로 참인데 귀무 가설을 기각할 확률이 5%임을 의미합니다.
- 데이터 수집 및 분석: 데이터를 수집한 다음 적절한 통계 테스트를 사용하여 분석합니다. 이렇게 하면 데이터가 귀무 가설에서 얼마나 벗어나는지 측정하는 테스트 통계가 생성됩니다.
- p-값 계산: p-값은 귀무 가설이 참이라고 가정할 때 관찰한 것만큼 극단적인 검정 통계량을 얻을 확률입니다. p-값이 유의 수준보다 작으면 결과가 통계적으로 유의하며 귀무 가설을 기각합니다.
- 결과 해석: p-값이 유의 수준보다 작으면 귀무 가설을 기각하고 연구 중인 변수 간에 통계적으로 유의한 차이 또는 관계가 있다는 결론을 내릴 수 있습니다. p-값이 유의 수준보다 크면 귀무 가설을 기각하지 못하고 유의한 차이나 관계를 뒷받침할 증거가 충분하지 않다는 결론을 내릴 수 없습니다.
- 결론 도출 및 결과 보고: 통계 분석을 바탕으로 연구 질문에 대한 결론을 도출하고 결과를 명확하고 간결하게 보고합니다.
* 간단 정리
유의성
(임계치, 검정통계량),
(유의수준, 유의확률)
C12. 외로운 사람을 위한 단일 표본 z-검정
1) 단일 표본의 정의
단일 표본 : 단일 표본에 대한 z-검정은 표본 평균이 알려진 모집단 평균 또는 가정된 모집단 평균과 유의하게 다른지 여부를 확인하는 데 사용되는 통계 검정입니다. 단일 샘플 z-테스트는 새로운 치료의 효과를 테스트하거나 여러 병원의 성능을 비교하는 등 빅 데이터 의료 산업의 다양한 애플리케이션에서 사용할 수 있습니다.
2) 단일 표본의 핵심 원리
- 귀무 가설 공식화: 귀무 가설은 모집단 평균이 특정 값과 같다는 것입니다. 대립 가설은 모집단 평균이 특정 값과 같지 않다는 것입니다.
- 유의 수준 결정: 귀무 가설이 참일 때 기각하는 제1종 오류를 범할 확률입니다. 일반적으로 0.05로 설정됩니다.
- 샘플 데이터 수집: 모집단에서 n 관측치의 무작위 샘플을 가져옵니다.
- 검정 통계량 계산: 검정 통계량은 (표본 평균 - 가설 평균) / (표준 편차 / sqrt(n))로 계산됩니다. 이것은 표본 평균이 가설 평균에서 벗어난 표준 오류의 수를 제공합니다.
- 임계값 계산: 임계값은 선택한 유의 수준에 해당하는 표준 정규 분포 값입니다.
- 검정 통계량을 임계값과 비교: 검정 통계량이 임계값보다 크면 귀무가설이 기각됩니다. 검정 통계량이 임계값보다 작으면 귀무가설이 기각되지 않습니다.
- 결과 해석: 귀무 가설이 기각되면 모집단 평균이 가설 값과 같지 않다는 증거가 있음을 의미합니다. 귀무가설이 기각되지 않는다면 모집단 평균이 가정된 값과 다르다고 말할 수 있는 충분한 증거가 없다는 것을 의미합니다.
3) 단일 표본 z-검정 검정 통계량 계산
z = (x - μ) / (σ / sqrt(n))
어디:
- z는 검정 통계량(z-점수)입니다.
- x는 표본 평균입니다.
- μ는 알려진 모집단 평균입니다.
- σ는 알려진 모집단 표준 편차입니다.
- n은 샘플 크기입니다.
계산된 z-점수가 임계값보다 크면 귀무 가설(표본 평균이 모집단 평균과 같음)이 기각되어 표본 평균과 모집단 평균 사이에 상당한 차이가 있음을 나타냅니다
신뢰 구간 // 있어도 되고 없어도 되는
* 단일 표본 z 검정 (차이를 보기 위해)
- 하는 이유 : 표본 평균이 모집단 평균과 유의하게 다른지 여부를 확인하기 위해 사용되는 통계 검정.
(모집단 표준 편차를 알거나 표본 크기가 충분히 클 때 표본 표준 편차가 모집단 표준 편차의 좋은 추정치라고 가정할 때)
- 귀무가설과 대립가설을 정의함.
- z점수인 검정 통계량을 계산함
296P
검정통계량 Z점수는 463P에서 찾아서 면적을 구할 수 있다.
297P
계산된 Z 값은 2.7
영섭님이 정리주신 것.
@유의성(significance)
1. 통계적 유의성: 우연에 의한 것(유의확률)이 아니라 어떤 요인에 의한 차이가 있다.
= 통계적으로 유의하다 = (유의확률(p))<유의수준(α, 1종오류))
2. 1종오류 / 2종오류
더 심각함☞1종오류(=유의수준(α)): 귀무가설이 참인데 기각, 연구가설 거짓인데 채택! "아닌데 맞다고?사기꾼!"
연구자가 감수하고자 하는 위험수준 (*0.05 **0.01 ***0.001)
2종오류(=β): 귀무가설이 거짓인데 채택, 연구가설 참인데 기각! "맞는데 아니라고?멍청이!"
3. 통계적 유의성 vs 의미있음: if 통계적으로 유의미하지만 평균은 0.1정도 미세한 차이가 난다면...?
4. 추론통계(모집단 추측): 우연한 결과 = p > α 유의확률(p)이 기각역(α)보다 더 왼쪽
<우측검정기준> '유의'한 결과 = α > p 유의확률(p)이 기각역(α)보다 더 '오른'쪽
5. 유의성 검증!!!
가설검정의 단계 1) 가설설정 2) 유의수준설정 3) 검정통계량선택(분석방법) 4) 검정통계량계산(유의확률까지)
5) 유의수준에 해당하는 임계값 계산 6) 임계값-검정통계량 비교 / 유의수준-유의확률 비교
7) 검정통계량과 유의수준이 '오른쪽'이라면 유의한 결과! 8) 왼쪽이면 귀무가설 채택
***기각역 = 귀무가설 기각, 연구가설 채택, 차이가 있다
= 유의수준(α)보다 유의확률(p) '면적'이 오른쪽! / 임계값보다 검정통계량 '값'이 오른쪽!
6. 신뢰구간: 신뢰수준은 '면적', 신뢰구간은 축에 있는 '값'. 임계값*표준오차 (표기: 평균±신뢰구간)
@단일 표본 z검정
1. 단일 표본 z검정: 모집단과 표본 1개만을 비교, z검정이라 z값이 검정통계량
***z = (표본평균x_bar-모집단평균mu)/표준오차SEM ***z = (관측치x-평균x_bar)/표준편차s
***SEM(표준오차) = (모집단 표준편차sigma or 표본 표준편차s)/표본의크기n**1/2
* 핵심
* 단일 표본 z 검정
유의성
추론통계
유의성 검정
- 유의성 검정의 작동 방법 : 계획 / 유의수준을 보는 것 , 검정 통계량을 보는 것
귀무가설(채택/기각)
'배운 책들 정리 > 만만한 통계 : R 활용' 카테고리의 다른 글
0220 만만한 통계 R - 상관계수 계산 및 유의성 검정, 보건의료(7,17) (0) | 2023.02.20 |
---|---|
0217 만만한 통계 R - 평균 차이 검정, 분산분석(ANOVA)(14,15) (1) | 2023.02.17 |
0216 만만한 통계 R - 독립 표본 t 검정, 종속 표본 t 검정 (0) | 2023.02.16 |
0214 만만한 통계 R - 가설검정, 확률의 중요성 (09,10) (0) | 2023.02.14 |
0213 만만한 통계 R - 기술 통계(평균,중앙,최빈값), 표준편차, 분산 (0) | 2023.02.13 |