본문 바로가기

개인공부 정리/다양한 질문들

0216 만만한 통계 R 질문 - 독립 표본 t 검정, 종속 표본 t-검정

Q1. 단일 표본 Z 검정과 독립 표본 T 검정의 차이점을 이해 못하겠어 각각 이를 설명해주고 두 가지의 테스트가 빅데이터 의료에서 어떤 차이를 갖는지 알려줄래?

 

틀림없이! 단일 표본 z 검정과 독립 표본 t 검정은 모두 표본 평균을 모집단 평균과 비교하는 데 사용되는 통계 검정이지만 사용되는 데이터 유형과 가정이 다릅니다.

단일 샘플 z-테스트는 데이터의 단일 샘플이 있고 그 평균을 알려진 모집단 평균과 비교하려는 경우에 사용됩니다. 검정에서는 표본이 무작위로 선택되고 모집단 표준 편차가 알려져 있다고 가정합니다. 검정 통계량은 표본 평균과 모집단 평균의 차이를 평균의 표준 오차로 나눈 값으로 계산됩니다. 검정 통계량은 표준 정규 분포를 따르므로 z-테이블을 사용하여 p-값을 찾고 표본 평균이 모집단 평균과 크게 다른지 여부를 확인할 수 있습니다.

반면에 독립 표본 t-검정은 두 독립 표본의 평균을 비교하려는 경우에 사용됩니다. 이 검정은 처리군과 대조군과 같은 두 집단의 평균 사이에 유의미한 차이가 있는지 여부를 확인하려는 경우에 사용됩니다. 검정에서는 두 표본이 무작위로 선택되고 독립적이며 분산이 같은 정규 분포를 따른다고 가정합니다(비동등 분산을 처리할 수 있는 t-검정의 변형이 있음). 검정 통계량은 두 그룹의 평균 차이를 차이의 표준 오차로 나눈 값으로 계산됩니다. 검정 통계량은 표본 크기와 비교할 그룹 수에 따라 자유도가 다른 t-분포를 따릅니다.

빅 데이터 의료 산업에서 단일 샘플 z-테스트는 혈압과 같은 환자의 건강 메트릭을 알려진 모집단 평균과 비교하여 환자의 건강이 정상 범위 내에 있는지 확인하는 데 사용될 수 있습니다. 독립 표본 t-검정은 치료군과 대조군과 같은 두 개의 독립적인 환자 그룹의 평균을 비교하여 특정 조건에 대한 두 가지 다른 치료의 효과를 비교하는 데 사용할 수 있습니다.

두 테스트의 주요 차이점은 단일 샘플 z-테스트는 단일 데이터 샘플에 사용되는 반면 독립 샘플 t-테스트는 두 개의 독립적인 데이터 샘플에 사용된다는 것입니다. 단일 표본 z 검정은 모집단 표준 편차를 알고 있다고 가정하고 독립 표본 t 검정은 두 그룹의 분산이 같다고 가정합니다. 테스트의 가정이 충족되지 않으면 테스트 결과가 정확하지 않을 수 있으므로 주어진 상황에서 사용할 적절한 테스트를 신중하게 고려하는 것이 중요합니다.

 

Q2. 통합 분산 추정치와 등분산 가정에 대해 자세히 설명해 주시겠습니까?

확신하는! 통합 분산 추정은 등분산 가정을 위반할 때 두 표본 t 검정에서 분산을 추정하는 방법입니다. 표준 독립 표본 t-검정에서 두 모집단의 분산이 같거나 적어도 동등하다고 취급할 수 있을 만큼 충분히 가깝다고 가정합니다. 그러나 실제로는 두 모집단의 분산이 다른 것이 일반적이며 이로 인해 t-검정에 문제가 발생할 수 있습니다.

이를 해결하기 위해 IVE(Integrated Variance Estimate)는 분산이 같지 않을 때 분산을 추정하는 방법이다. 두 그룹의 샘플 분산을 합동 분산의 단일 추정치로 결합하여 작동합니다. IVE의 공식은 다음과 같습니다.

IVE = [(n1 - 1)s1^2 + (n2 - 1)s2^2] / (n1 + n2 - 2)

여기서 s1^2 및 s2^2는 두 그룹의 표본 분산이고 n1 및 n2는 표본 크기입니다. 그런 다음 IVE는 t-테스트 통계를 계산하기 위해 표준 통합 분산 추정치 대신 사용됩니다.

등분산 가정은 독립 표본 t 검정에서 두 평균 차이의 표준 오차에 영향을 미치기 때문에 중요합니다. 분산이 같으면 두 표본 분산을 통합하는 간단한 공식을 사용하여 표준 오차를 추정할 수 있습니다. 그러나 분산이 같지 않으면 공식이 더 복잡해지고 표준 오차 추정값의 정확도가 떨어집니다.

빅데이터 의료 산업에서 등분산 가정과 통합 분산 추정의 사용은 통계적 테스트의 정확성을 보장하는 데 중요합니다. 예를 들어, 특정 조건에 대한 두 가지 치료를 비교하는 임상 시험에서 두 치료 그룹 간에 결과 변수의 분산이 다른 경우 등분산 가정이 위반될 수 있습니다. 이 경우 분산 차이를 설명하기 위해 통합 분산 추정치를 사용하여 t-테스트 통계 계산을 조정할 수 있습니다. 이렇게 하면 테스트가 정확하고 두 치료 간의 차이가 단순히 우연에 의한 것이 아님을 확인하는 데 도움이 될 수 있습니다.

 

Q3. 독립 표본 T 검정에서 검정 통계량을 계산할 때 공식을 자세히 이해하지 못합니다. 빅데이터 의료산업과 관련하여 말씀해 주시겠습니까?

 

확신하는! 독립 표본 t 검정에서 검정 통계량을 계산하는 공식은 다음과 같습니다.

t = (x1 - x2) / 남동

어디:

  • x1은 첫 번째 그룹의 평균입니다(예: 치료 그룹에 있는 환자의 평균 혈압).
  • x2는 두 번째 그룹의 평균입니다(예: 대조군 환자의 평균 혈압).
  • SE는 두 평균 차이의 표준 오차입니다.

차이의 표준 오차(SE)는 다음과 같이 계산됩니다.

SE = sqrt((s1^2/n1) + (s2^2/n2))

어디:

  • s1 및 s2는 두 그룹의 표본 표준 편차입니다.
  • n1과 n2는 두 그룹의 표본 크기입니다.

검정 통계량의 공식은 복잡해 보이지만 간단한 개념을 기반으로 합니다. 두 그룹의 평균 차이를 차이의 표준 오차로 나눈 값입니다. 테스트 통계는 두 평균 간의 차이가 얼마나 많은 표준 오류인지 알려줍니다. 검정 통계량의 절대값이 크면 두 그룹의 평균이 유의하게 다르다는 것을 나타냅니다.

빅 데이터 의료 산업의 맥락에서 독립 표본 t-검정은 두 개의 독립적인 환자 그룹의 평균을 비교하여 특정 상태에 대한 두 가지 다른 치료의 효과를 비교하는 데 사용할 수 있습니다. 예를 들어 연구자는 치료군과 대조군 환자의 평균 혈압을 비교하여 고혈압 치료를 위한 두 가지 다른 약물의 효과를 비교하고자 할 수 있습니다. 연구자는 치료군의 평균 혈압에서 대조군의 평균 혈압을 빼고 그 차이의 표준 오차로 나누어 검정 통계량을 계산합니다. 검정 통계량의 절대값이 크면 두 집단의 평균 혈압이 유의하게 다르다는 것을 의미하며,

독립 표본 t 검정은 비교되는 두 그룹이 독립적이고 무작위로 선택되며 분산이 동일한 정규 분포를 따른다고 가정한다는 점에 유의하는 것이 중요합니다. 이러한 가정이 충족되지 않으면 테스트가 정확한 결과를 제공하지 못할 수 있으며 대체 통계 테스트가 더 적절할 수 있습니다.

 

Q4. 독립 표본 t 검정에서 통합 분산 추정치에 대한 식을 설명해줄래?

독립 표본 t-검정은 두 개의 독립적인 데이터 그룹의 평균을 비교하는 데 사용되는 통계 검정입니다. 각 그룹의 데이터가 정규 분포를 따르고 분산이 동일한 경우에 사용됩니다. 통합 분산의 추정치는 일반적으로 독립 표본 t-검정에서 사용되지 않습니다. 대신 독립 표본 t-검정에 대한 검정 통계량은 두 그룹의 평균 차이와 해당 평균의 표준 오차를 사용하여 계산됩니다.

독립 표본 t-검정의 검정 통계량 공식은 다음과 같습니다.

t = (x1 - x2) / (s * sqrt(1/n1 + 1/n2))

어디:

  • t는 검정 통계량입니다.
  • x1은 그룹 1의 평균입니다.
  • x2는 그룹 2의 평균입니다.
  • s는 두 그룹의 합동 표준 편차이며 다음과 같이 계산됩니다.여기서 s1과 s2는 두 그룹의 표준 편차이고 n1과 n2는 두 그룹의 표본 크기입니다.
  • s = sqrt(((n1 - 1) * s1^2 + (n2 - 1) * s2^2) / (n1 + n2 - 2))
  • n1과 n2는 두 그룹의 표본 크기입니다.

검정 통계량은 자유도가 n1 + n2 - 2인 ​​t-분포의 임계값과 비교되어 두 그룹 간의 평균 차이가 통계적으로 유의한지 여부를 결정합니다.

통합 분산의 추정치는 금융의 변동성 모델링과 같은 다른 유형의 통계 분석에 사용되지만 독립 샘플 t-테스트에는 사용되지 않는다는 점에 주목할 가치가 있습니다.

 

Q5. 지금 보여준 식을 빅데이터 의료 산업과 연관해서 예시를 통해 설명해줄래?

 

물론 다음은 독립 샘플 t-테스트가 빅 데이터 의료 산업에서 어떻게 사용될 수 있는지에 대한 예입니다.

제약 회사가 특정 질병을 치료하기 위해 신약을 테스트하고 있다고 가정합니다. 회사는 임상 시험에 참여할 두 그룹의 환자를 모집합니다. 즉, 신약을 받는 치료 그룹과 위약을 받는 대조군입니다.

회사는 약물이 통계적으로 유의미한 효과가 있는지 확인하기 위해 치료군과 대조군 사이의 특정 건강 결과 측정의 평균 점수를 비교하는 데 관심이 있습니다.

회사에서 다음 데이터를 수집한다고 가정해 보겠습니다.

  • 치료군: 30명, 평균 70점, 표준편차 5점
  • 대조군: 환자 30명, 평균 65점, 표준편차 4

독립 표본 t 검정을 수행하기 위해 먼저 두 그룹의 합동 표준 편차를 계산합니다.

s = sqrt(((n1 - 1) * s1^2 + (n2 - 1) * s2^2) / (n1 + n2 - 2)) = sqrt(((30 - 1) * 5^2 + (30 - 1) * 4^2) / (30 + 30 - 2)) = 4.50

다음으로 검정 통계량을 계산합니다.

t = (x1 - x2) / (s * sqrt(1/n1 + 1/n2)) = (70 - 65) / (4.50 * sqrt(1/30 + 1/30)) = 4.72

0.05의 유의 수준과 양측 검정을 사용한다고 가정하면 검정 통계량 4.72를 자유도가 58인 t-분포(30 + 30 - 2)의 임계값(약 2.00)과 비교할 것입니다. . 검정 통계량이 임계값보다 훨씬 크기 때문에 귀무 가설을 기각하고 처리군과 대조군 사이의 평균 점수 차이가 통계적으로 유의하다는 결론을 내릴 것입니다. 이것은 신약이 위약보다 건강 결과 측정을 개선하는 데 더 효과적이라는 것을 시사합니다.

이 예에서는 독립 표본 t-검정에 대한 방정식을 사용하여 처리군과 대조군 사이에 평균 점수에 차이가 없다는 귀무가설을 검정했습니다. 테스트 통계를 계산하고 이를 임계 값과 비교함으로써 평균 점수의 차이가 통계적으로 유의미한지 여부를 결정할 수 있었으며 이는 빅 데이터 의료 산업에 귀중한 통찰력을 제공할 수 있습니다.

 

Q6. Z점수와 검정통계량의 차이가 뭐야? 빅데이터 의료 산업과 연관해서 알려줘

Z 점수와 검정 통계량은 둘 다 가설 검정에 사용되지만 기본 가정과 적용이 다릅니다.

Z 점수는 데이터 포인트가 정규 분포의 평균에서 벗어난 표준 편차의 수를 나타내는 표준화된 값입니다. 일반적으로 확률을 계산하고 모집단 평균 또는 비율과 같은 단일 모집단 매개변수에 대해 추론하는 데 사용됩니다. 빅 데이터 의료 산업에서 Z 점수는 종종 모집단의 이상값을 식별하거나 치료의 효능을 평가하거나 여러 의료 시설에서 환자 결과를 비교하는 데 사용됩니다.

반면 검정 통계량은 t-분포 또는 F-분포와 같은 분포의 임계값과 비교하여 가설을 검정하는 데 사용되는 계산된 값입니다. 일반적으로 두 모집단이 다른지 또는 특정 회귀 모델이 데이터에 잘 맞는지 여부를 확인하기 위해 가설 검정에 사용됩니다. 빅 데이터 의료 산업에서 테스트 통계는 종종 둘 이상의 환자 그룹의 평균 또는 분산을 비교하거나 특정 치료 또는 개입의 중요성을 평가하거나 의료 데이터에 대한 기계 학습 모델의 성능을 평가하는 데 사용됩니다.

 

Q7. T 검정 통계량의 8단계 계산 과정에 대해 자세히 설명해줄래?

물론, 독립 표본에 대한 T 검정 통계량을 계산하는 8단계는 다음과 같습니다.

  1. 귀무 가설 및 대립 가설 정의 (등분산 분석): 귀무 가설은 일반적으로 두 독립 그룹의 평균 사이에 유의한 차이가 없다는 것을 나타내는 반면, 대립 가설은 유의한 차이가 있음을 나타냅니다.
  2. 유의 수준(알파) 및 자유도(df) 결정: 알파 수준은 일반적으로 0.05로 설정되며, 이는 제1종 오류를 범할 확률이 5%임을 의미합니다(귀무 가설이 참일 때 기각). . 자유도는 n1 + n2 - 2와 같습니다. 여기서 n1과 n2는 두 그룹의 샘플 크기입니다.
  3. 데이터를 수집하고 표본 평균(x̄1 및 x̄2)과 표본 표준 편차(s1 및 s2)를 계산합니다. 이러한 통계는 두 그룹의 중심 경향과 변동성을 설명합니다.
  4. 평균 차이의 표준 오차(SE) 계산: 표준 오차는 다음 공식을 사용하여 계산됩니다. SE = √((s1^2/n1) + (s2^2/n2)).
  5. 검정 통계량(t) 계산: 검정 통계량은 다음 공식을 사용하여 계산됩니다. t = (x̄1 - x̄2) / SE.
  6. t의 임계값 결정: 이것은 알파 수준과 자유도에 따라 다릅니다. 예를 들어, alpha = 0.05 및 df = 18인 경우 t의 임계값은 ±2.101입니다.
  7. 검정 통계량을 임계값과 비교: 검정 통계량의 절대값이 임계값보다 크면 귀무가설이 기각되고 대립가설이 채택됩니다.
  8. 결과 해석: 귀무 가설이 기각되면 두 그룹의 평균 사이에 유의미한 차이가 있음을 의미합니다. 차이의 크기는 Cohen의 d 또는 Hedges의 g와 같은 효과 크기를 사용하여 정량화할 수 있습니다.

이러한 단계는 일반적으로 빅 데이터 의료 산업에서 두 ​​그룹의 평균을 비교하기 위해 독립적인 샘플 t-테스트를 ​​수행할 때 따릅니다. t-테스트는 의학 연구에서 널리 사용되는 통계 도구이며 치료 효과를 평가하거나 여러 의료 시설에서 환자 결과를 비교하거나 의료 데이터에 대한 기계 학습 모델의 성능을 평가하는 데 사용할 수 있습니다.

 

Q8 독립표본 t 검정은 빅데이터 의료 산업에서 일반적으로 단측검정을 하니 양측검정을 하니?

한쪽 또는 양쪽에서 독립 표본 t-테스트를 ​​수행할지 여부는 연구 질문과 테스트 중인 가설에 따라 결정됩니다.

 

연구 질문이 한 그룹의 평균이 다른 그룹의 평균보다 크거나 작은지에 관한 것이라면 단측 t-검정을 수행할 수 있습니다. 예를 들어, 연구는 새로운 약물 치료가 기존 치료보다 나은지 여부를 결정하는 데 관심이 있을 수 있습니다. 이 경우 단측 t-검정을 사용하여 새 치료군의 평균 개선이 기존 치료군의 평균 개선보다 크다는 가설을 검정할 수 있습니다.

 

반면 연구문제가 방향을 지정하지 않고 단순히 두 집단의 평균이 다른가에 관한 것이라면 양측 t-검정이 적합하다. 예를 들어, 어떤 그룹이 더 높은 평균을 갖는지 지정하지 않고 두 그룹 사이의 평균 혈압 수준에 차이가 있는지 여부를 결정하는 연구에 관심이 있을 수 있습니다.

궁극적으로 단측 또는 양측 t-테스트 수행 결정은 특정 연구 질문과 테스트 중인 가설을 기반으로 해야 합니다.

 

Q9. 독립표본 t검정에 대한 검정통계량을 계산할 때 분자에서 각각 그룹의 평균을 빼는 이유가 뭐야?

 

독립 표본 t 검정에서 검정 통계량은 두 독립 그룹의 평균 차이를 각 그룹 내의 변동성과 비교하여 계산됩니다. t-검정 통계량의 공식은 다음과 같습니다.

t = (평균1 - 평균2) / (s_pooled * sqrt(1/n1 + 1/n2))

여기서 mean1과 mean2는 비교되는 두 그룹의 평균이고 s_pooled는 두 그룹의 풀링된 표준 편차이며 n1과 n2는 각 그룹의 샘플 크기입니다.

각 그룹의 평균을 분자에서 빼는 이유(mean1 - mean2)는 분포를 0에 중심을 두기 위함입니다. 각각의 관찰에서 각 그룹의 평균을 빼서 평균에서 편차를 얻습니다. 이러한 편차는 양수 또는 음수일 수 있지만 합계는 항상 0입니다. 두 그룹의 평균을 서로 빼서 기본적으로 표준 편차 및 기타 통계 매개변수를 계산하는 데 필요한 0 주변의 차이 점수 분포를 중심에 둡니다.

두 그룹의 평균을 서로 빼면 평균 차이의 크기와 방향을 결정할 수도 있습니다. 차이가 양수이면 첫 번째 그룹의 평균이 두 번째 그룹의 평균보다 높다는 것을 의미하고, 차이가 음수이면 두 번째 그룹의 평균이 첫 번째 그룹의 평균보다 높다는 것을 의미합니다. 

 

Q10. T검정에서 임계값을 구할 때 분자에서 (1-alpha)를 하는 이유가 뭔지 알 수 있을까?

T-테스트에서 임계값을 계산하기 위한 공식의 (1-알파)는 테스트를 위해 선택한 유의 수준과 관련이 있습니다. 알파로 표시되는 유의 수준은 귀무가설이 실제로 참일 때 기각할 확률인 제1종 오류를 범할 최대 확률입니다.

1에서 알파를 빼면 테스트의 신뢰 수준을 나타내는 (1-알파)를 얻습니다. 예를 들어 알파 = 0.05의 유의 수준을 선택하면 테스트의 신뢰 수준은 (1-0.05) = 0.95 또는 95%입니다. 이는 귀무가설이 참이라고 가정할 때 테스트 결과가 임계값에 의해 결정된 값 범위에 속할 확률이 95%라는 것을 의미합니다.

따라서 (1-알파)는 선택한 유의 수준과 데이터의 가정된 분포를 기반으로 통계적으로 유의한 것으로 간주되는 값의 범위를 결정하기 위해 T-검정에서 임계값을 계산하는 공식에 사용됩니다.

 

Q11. 그렇다면 (-2 - alpha)는 안되는거야?

 

네, (1-알파) 대신 (-2-알파)를 사용하는 것은 T-테스트에서 임계값을 계산하는 데 적합하지 않습니다.

(1-alpha)의 값은 귀무가설이 실제로 거짓인 경우 귀무가설을 올바르게 기각할 확률인 테스트의 신뢰 수준을 나타냅니다. 반대로 (-2-알파)는 T-검정의 맥락에서 의미 있는 해석을 갖지 않으며 통계적 유의성을 결정하기 위한 유효한 임계값을 제공하지 않습니다.

T-test에서 (1-alpha)의 사용은 통계적 이론과 실제에 근거한 관례이며 적절하게 사용할 경우 신뢰할 수 있고 정확한 결과를 제공하는 것으로 나타났습니다.

 

Q12. 독립표본 t검정을 할때 등분산인지 아닌지 확인해야 하는 이유가 뭐야? 빅데이터 의료 산업과 연관해서 설명해줄래?

 

등분산 가정은 t-통계량 및 결과 p-값의 계산에 영향을 미치기 때문에 독립 표본 t-검정에서 등분산을 확인하는 것이 중요합니다. 비교하는 두 그룹의 분산이 크게 다른 경우 등분산 가정이 위반되고 t-검정 결과가 정확하지 않을 수 있습니다.

 

빅 데이터 의료 산업에서 독립 표본 t-검정은 일반적으로 두 데이터 그룹의 평균을 비교하는 데 사용됩니다. 예를 들어, 두 개의 다른 치료 그룹에 있는 환자의 평균 혈압을 비교하는 데 사용할 수 있습니다. 두 그룹의 분산이 같지 않은 경우 분산이 같다고 가정하는 표준 t-검정 절차를 사용하면 잘못된 결론이 나올 수 있습니다.

 

등분산을 확인하려면 Levene의 테스트 또는 F-테스트와 같은 통계 테스트를 사용할 수 있습니다. 검정에서 분산이 유의하게 다른 것으로 나타나면 Welch의 t-검정 또는 Satterthwaite의 t-검정과 같이 같지 않은 분산을 설명하는 수정된 버전의 t-검정을 사용할 수 있습니다. 이러한 테스트는 t-통계량의 계산과 자유도를 조정하여 두 그룹 간의 분산 차이를 설명합니다.

 

Q13. 등분산 분석과 이분산 분석의 차이가 무엇인지 알려주고 이게 빅데이터 의료 산업에서 어떤 영향이 있는지 알려줄래?

등분산 분석과 이분법 분석은 빅 데이터 의료 산업에서 사용되는 두 가지 유형의 통계 분석입니다.

분산 테스트의 동질성 테스트라고도 하는 등분산 분석은 두 개 이상의 그룹의 분산이 같다는 가정을 테스트하는 데 사용되는 통계 기법입니다. 이것은 독립 표본 t-검정이 비교되는 두 그룹의 분산이 동일하다고 가정하기 때문에 중요합니다. 분산이 같지 않으면 t-검정이 편향되어 잘못된 결론을 내릴 수 있습니다. 이러한 경우 Welch의 t-검정 또는 Satterthwaite 근사와 같은 조정된 t-검정을 사용하여 불평등 분산을 수정할 수 있습니다.

 

반면에 이분법 분석은 결과 변수가 이분법적일 때 사용되는 통계 기법입니다. 즉, 성공 또는 실패, 긍정적 또는 부정적, 살아 있거나 죽은 것과 같은 두 가지 값 중 하나만 취할 수 있음을 의미합니다. 이러한 유형의 분석은 환자가 특정 치료에 반응하는지 여부와 같이 관심 있는 결과가 이진 반응일 때 의학 연구에 사용됩니다. 로지스틱 회귀 또는 카이 제곱 테스트와 같은 기술은 일반적으로 이분법 분석에 사용됩니다.

요약하면, 빅데이터 의료 산업에서 통계 기법의 선택은 분석되는 데이터 유형, 질문되는 연구 질문 및 분석의 기초가 되는 가정에 따라 달라집니다. 등분산 분석은 비교 대상 그룹의 등분산 가정을 테스트하는 데 사용되며, 이분 분석은 결과 변수가 이분법일 때 사용됩니다.

 

Q14. 그렇다면 등분산 분석에서 p-VALUE가 0.8이고 이분산 분석에서 P-VALUE가 0.8가 나왔다면 무슨 의미인지 알려줄래? 빅데이터 의료 사례를 예시로 들어줘

 

등분산분석과 이분분석 모두 p-value가 0.8이면 비교 대상인 두 집단 간에 통계적으로 유의한 차이가 없다는 뜻이다.

즉, 귀무가설(즉, 두 그룹 간에 차이가 없다는 가정)을 기각할 수 없습니다.

이는 두 그룹 간에 관찰된 차이가 우연에 의한 것일 수 있음을 나타냅니다.

 

예를 들어 특정 상태에 대한 두 가지 다른 치료법의 효과를 비교하기 위해 빅 데이터 의학 연구를 수행한다고 가정합니다. 이 연구는 환자를 두 치료 그룹 중 하나에 무작위로 할당하고 결과를 측정합니다. 등분산 분석과 이분 분석 모두에서 p-값이 0.8이면 두 처리군 간에 결과에 유의한 차이가 없음을 시사합니다. 이것은 두 치료법이 똑같이 효과적이거나 연구가 차이를 감지할 만큼 충분한 검정력이 없다는 것을 의미할 수 있습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90
반응형
LIST