본문 바로가기

개인공부 정리/다양한 질문들

0220 만만한 통계 R 질문 - 상관계수 계산 및 유의성 검정, 보건의료(7,17)

Q1.상관계수가 0.4라면 큰 수치인가요?

상관 계수의 크기는 맥락과 연구 분야에 따라 다릅니다. 그러나 0.4의 상관 계수는 두 변수 사이에 적당한 양의 관계가 있음을 나타냅니다. 일반적으로 상관계수가 -0.3~0.3이면 약한 관계, -0.7~-0.3 또는 0.3~0.7이면 중간 정도, -0.7보다 작거나 0.7보다 크면 강한 상관관계를 나타낸다.

 

Q2. 상관 계수를 처음 배울 때 좋은 질문이 무엇인지 말씀해 주시겠습니까?

  1. 상관 계수는 무엇이며 무엇을 측정합니까?
  2. 상관 계수는 어떻게 계산됩니까?
  3. 상관 계수에 대해 가능한 값의 범위는 무엇입니까?
  4. 상관 계수의 크기와 방향을 어떻게 해석합니까?
  5. 양의 상관 관계와 음의 상관 관계의 차이점은 무엇입니까?
  6. 변수 간의 관계를 식별하기 위해 상관 계수를 어떻게 사용할 수 있습니까?
  7. 상관 계수의 몇 가지 제한 사항은 무엇입니까?
  8. 상관 계수를 해석할 때 피해야 할 일반적인 실수는 무엇입니까?
  9. 상관 계수의 중요성을 어떻게 테스트할 수 있습니까?
  10. 변수 간의 인과 관계를 설정하는 데 상관 계수를 사용할 수 있습니까?

Q3. 상관 계수 1은 무엇을 의미하며 몇 가지 예는 무엇입니까?

상관 계수 1은 두 변수 사이의 완전한 양의 상관관계를 나타냅니다. 즉, 두 변수가 완벽하게 선형적으로 관련되어 있고 한 변수가 증가하면 다른 변수도 정비례하여 증가합니다. 예를 들어 개인의 키와 몸무게를 측정하는 데이터 세트가 있는 경우 이 두 변수 사이의 상관 계수가 1이면 키가 큰 사람이 더 무겁고 그 반대의 경우도 마찬가지임을 나타냅니다. 또 다른 예는 공부한 시간과 시험에서 얻은 등급 사이의 관계일 수 있습니다. 상관 계수 1은 공부한 시간이 증가함에 따라 획득한 등급도 완벽하게 선형 방식으로 증가한다는 것을 나타냅니다.

 

Q4. 변수 사이의 상관계수를 구하는 공식을 알려줘. (10개의 상관계수를 구하는 법). 그리고 이유까지

공식

* 쉽게

n(n-1)/2

 

* 어렵게

nCk = n! / (k! * (nk)!)
10C2 = 10! / (2! * (10-2)!) = 45

 

Q5. n(n-1)/2 이런 식이 나오는 이유에 대해서 모르겠어. 

물론! 더 간단한 방법으로 설명하겠습니다.

4명의 친구가 있고 각 쌍의 친구가 얼마나 비슷한지 알고 싶다고 상상해 보십시오. 이를 위해 몇 가지 질문에 답하도록 요청한 다음 "상관 계수"라는 숫자를 계산할 수 있습니다. 이 숫자는 그들이 얼마나 유사하거나 다른지를 알려줍니다.

각 친구 쌍에 대해 이 수를 계산하면 AB, AC, AD, BC, BD 및 CD의 6가지 상관 계수로 끝납니다.

이제 5명의 친구가 있다고 상상해 보십시오. 각 쌍에 대한 상관 계수를 계산하려면 10개의 상관 계수가 필요합니다.

따라서 가능한 상관 계수의 수는 친구가 많을수록 빠르게 증가합니다. n명의 친구가 있는 경우 가능한 상관 계수의 수는 n(n-1)/2입니다.

공식을 사용하는 이유는 n에 n-1을 곱하기만 하면 각 친구 쌍을 두 번(AB 및 BA) 계산하기 때문입니다. 따라서 두 번 계산하지 않으려면 2로 나눕니다.

 

Q6. 두 번 계산하지 않으려면 2로 나눈다는 말이 무슨말이야?

"두 번 계산하지 않으려면 2로 나누기"라는 문구는 세트의 고유한 쌍 수에 대한 공식을 기억하는 데 도움이 되는 니모닉 또는 기억 보조 도구입니다.

그룹의 다른 모든 사람과 악수를 원하는 그룹을 생각해 보십시오. n명이 있다면 총 악수 횟수는 n(n-1)이 될 것입니다. 첫 번째 사람은 n-1명과 악수할 수 있고 두 번째 사람은 n-1명과 악수할 수 있기 때문입니다. 이미 첫 번째 사람과 악수) 등. 그러나 각 악수는 악수에 관련된 두 사람에 대해 한 번씩 두 번 계산되므로 고유한 쌍의 수를 얻으려면 총 악수 수를 2로 나누어야 합니다.

따라서 n명의 그룹에서 고유한 쌍의 수에 대한 공식은 다음과 같습니다.

n(n-1)/2

"두 번 계산하고 싶지 않으면 2로 나누기"라는 문구는 이 공식에서 2단계로 나누기를 기억하는 방법입니다.

 

Q7. 단순 상관계수의 공식을 이해 못하겠어. 내가 초등학생이라고 가정하고 쉽게 설명해줄래?

물론, 이해하기 쉬운 방식으로 간단한 상관 계수를 설명하게 되어 기쁩니다.

단순 상관 계수는 두 세트의 숫자가 서로 얼마나 밀접하게 관련되어 있는지 알려주는 숫자입니다. 숫자는 항상 -1과 1 사이입니다.

단순 상관 계수가 1이면 두 숫자 집합이 양의 방식으로 서로 완벽하게 관련되어 있음을 의미합니다. 예를 들어 어떤 사람이 시험을 위해 공부한 시간과 해당 시험의 점수를 비교하는 경우 간단한 상관 계수 1은 공부를 많이 할수록 점수가 높다는 것을 의미합니다.

단순 상관 계수가 -1이면 두 숫자 집합이 음의 방식으로 서로 완벽하게 관련되어 있음을 의미합니다. 예를 들어 TV 시청 시간을 학점 평균과 비교하는 경우 간단한 상관 계수 -1은 TV를 많이 볼수록 학점 평균이 낮다는 것을 의미합니다.

단순 상관 계수가 0이면 두 숫자 집합 간에 관계가 없음을 의미합니다. 예를 들어, 누군가가 매일 밤 잤던 시간을 자신이 좋아하는 색과 비교한다면 이 두 가지 사이에 관계가 없기 때문에 단순 상관 계수는 0에 가깝다고 예상할 수 있습니다.

단순 상관 계수를 계산하는 공식은 다음과 같습니다.

r = Σ[(x - x̄) * (y - ȳ)] / √[(Σ(x - x̄)²) * (Σ(y - ȳ)²)]

하지만 공식이 이해하기 어렵다면 너무 걱정하지 마세요. 중요한 것은 단순 상관 계수 뒤에 있는 개념과 숫자가 의미하는 바를 이해하는 것입니다.

 

Q8. 결정계수가 0.64일 때 상관계수는 얼마인가요? 그리고 이유를 설명해주세요

상관 계수는 결정 계수의 제곱근입니다. 따라서 결정계수가 0.64라면 상관계수는 0.64의 제곱근인 0.8이다.

결정 계수(R 제곱)는 회귀선이 데이터 포인트에 얼마나 잘 맞는지 측정한 것입니다. 독립 변수(x)로 설명되는 종속 변수(y)의 분산 비율을 나타냅니다. 0과 1 사이의 값으로 표현됩니다. R-제곱 값이 1에 가까울수록 회귀선이 데이터 점에 더 잘 맞는 것입니다. 이 경우 R-제곱이 0.64라는 것은 회귀선이 종속 변수 분산의 64%를 설명한다는 것을 나타내며 이는 상대적으로 강한 관계입니다.

 

Q9. 주석의 줄바꿈이 이어지도록 하는 방법을 알려주세요

줄바꿈 한번에 표시하려면 글로벌 옵션 들어가서 code -> soft-wrap하면 가능

 

Q10. 우리가 가설을 검증하려고 할 때 필요한 방법으로상관계수, 유의성 검증, 회귀분석 이게 끝이야?

가설 테스트에는 일반적으로 관계의 상관 계수와 유의 수준을 단순히 조사하는 것보다 더 공식적이고 엄격한 프로세스가 포함됩니다. 상관 및 회귀 분석은 두 변수 간의 관계에 대한 유용한 통찰력을 제공할 수 있지만 가설 테스트에는 귀무 가설 및 대체 가설 개발, 데이터 수집 및 통계 테스트를 사용하여 대체 가설을 뒷받침하는 증거가 있는지 여부를 결정하는 작업이 포함됩니다.

다음은 가설 테스트와 관련된 단계에 대한 일반적인 개요입니다.

  1. 귀무 가설 및 대립 가설 공식화: 귀무 가설은 일반적으로 관심 변수 사이에 "영향 없음" 또는 "관계 없음"에 대한 진술인 반면 대립 가설은 테스트 중인 효과 또는 관계에 대한 진술입니다.
  2. 유의 수준 선택: 유의 수준은 귀무 가설이 실제로 참일 때 귀무 가설을 기각할 확률입니다. 일반적인 유의 수준은 0.05로, 제1종 오류를 범할 확률이 5%에 해당합니다(귀무 가설이 실제로 참인데 귀무 가설을 기각함).
  3. 데이터 수집 및 준비: 관심 변수에 대한 데이터를 수집하고 분석을 위해 준비합니다.
  4. 적절한 통계 테스트 선택: 데이터의 특성과 테스트 중인 가설에 따라 t-테스트, ANOVA 또는 카이제곱 테스트와 같은 적절한 통계 테스트를 선택해야 합니다.
  5. 통계 테스트 수행: 소프트웨어 또는 통계 테이블을 사용하여 테스트 통계 및 관련 p-값을 계산합니다.
  6. 결과 해석: p-값이 선택한 유의 수준보다 작은 경우 귀무 가설을 기각하고 대립 가설을 선택할 수 있습니다. 그렇지 않으면 귀무 가설을 기각하지 못합니다.

이것은 가설 검정 프로세스의 일반적인 개요일 뿐이며 구체적인 세부 사항은 연구 질문의 특성과 분석 중인 데이터에 따라 다를 수 있습니다.

 

Q11. 결정 계수와 방금 구한 결정계수가 왜 상관 계수의 제곱인지 모르겠어. 초등학생이라고 생각하고 쉽게 알려줄 수 있니?

물론, 더 쉽게 설명해 드리겠습니다.

상관 계수(r)는 두 변수의 데이터 포인트가 직선을 얼마나 가깝게 따르는지를 측정합니다. 범위는 -1에서 1까지이며 0은 상관관계가 없음을 나타내고 1은 완벽한 양의 상관관계를 나타냅니다.

결정 계수(R-제곱)는 두 변수 간의 관계 강도를 측정하는 또 다른 척도입니다. 한 변수의 변동 비율이 다른 변수로 설명될 수 있는 비율을 알려줍니다. R-제곱의 범위는 0에서 1까지이며, 0은 다른 변수가 변동을 전혀 설명하지 않음을 나타내고 1은 다른 변수가 모든 변동을 설명함을 나타냅니다.

이제 R-제곱이 상관 계수의 제곱과 같은 이유는 무엇입니까? 그것에 대해 생각하는 간단한 방법은 다음과 같습니다.

상관 계수를 계산할 때 데이터 포인트가 직선을 얼마나 가깝게 따르는지 측정합니다. 데이터 포인트가 선에 가까울수록 상관 계수가 높습니다. 상관 계수는 선의 기울기가 양수인지 음수인지에 따라 양수 또는 음수가 될 수 있습니다.

결정 계수를 계산할 때 한 변수의 변동이 다른 변수로 설명될 수 있는 정도를 측정합니다. 즉, 데이터 포인트가 선 주위에 얼마나 밀접하게 모여 있는지 살펴보고 있습니다. 데이터 포인트가 선에 가까울수록 다른 변수로 더 많은 변동을 설명할 수 있습니다.

이제 상관 계수를 제곱한다고 상상해보십시오. 우리가 하는 일은 기본적으로 음수 부호(있는 경우)를 제거하고 값을 양수로 바꾸는 것입니다. 그러나 우리는 다른 일도 하고 있습니다. 즉, 가치를 확대하고 있습니다. 1보다 작은 수를 제곱하면 더 작은 수가 됩니다. 예를 들어 0.5를 제곱하면 0.25가 됩니다. 따라서 상관 계수를 제곱하면 데이터 포인트가 선에 근접한 효과가 확대됩니다. 이것이 바로 R-제곱이 상관 계수의 제곱과 같은 이유입니다. R-제곱은 다른 변수로 설명할 수 있는 한 변수의 변동량을 측정하고 데이터 포인트가 선에 근접한 효과를 확대합니다.

 

Q12. 내가 상관계수와 결정 계수에 대한 개념을 잘 몰라서 그런데 초등학생이라고 생각하고 쉽게 설명해줄 수 있니?

물론 이러한 개념을 더 간단한 용어로 설명할 수 있다면 기쁠 것입니다.

 

상관 계수는 두 데이터 세트가 서로 얼마나 밀접하게 관련되어 있는지 알려주는 숫자입니다. 두 명의 친구가 있고 그들의 운동량과 체중 사이에 연관성이 있는지 알고 싶다고 상상해 보십시오. 각각의 운동량과 체중에 대한 데이터를 수집한 다음 공식을 사용하여 상관 계수를 계산할 수 있습니다. 상관 계수는 -1과 1 사이의 숫자입니다. 숫자가 1에 가까우면 두 변수(이 경우 운동과 체중) 사이에 강한 양의 관계가 있음을 의미합니다. 숫자가 -1에 가까우면 강한 음의 관계가 있음을 의미합니다. 즉, 한 변수가 올라가면 다른 변수는 내려갑니다. 숫자가 0에 가까우면 두 변수 사이에 관계가 없음을 의미합니다.

 

결정 계수는 한 데이터 집합의 변동이 다른 데이터 집합으로 설명될 수 있는 정도를 알려주는 숫자입니다. 정크 푸드를 좋아하는 친구가 있고 정크 푸드 소비가 병에 걸릴 위험과 관련이 있는지 알고 싶다고 상상해 보십시오. 그들이 얼마나 많은 정크 푸드를 먹고 얼마나 자주 병에 걸리는지에 대한 데이터를 수집한 다음 공식을 사용하여 결정 계수를 계산할 수 있습니다. 결정 계수는 0과 1 사이의 숫자가 될 것입니다. 숫자가 1에 가까우면 친구가 얼마나 자주 병에 걸리는지의 거의 모든 변화가 그들이 얼마나 많은 정크 푸드를 먹느냐에 따라 설명될 수 있음을 의미합니다. 숫자가 0에 가까우면 두 변수 사이에 관계가 없음을 의미합니다.

요약하자면, 상관 계수는 두 데이터 세트가 서로 얼마나 밀접하게 관련되어 있는지 알려주는 반면 결정 계수는 한 데이터 세트의 변동이 다른 데이터 세트로 설명될 수 있는 정도를 알려줍니다.

 

상관계수 : 두 데이터 세트가 서로 얼마나 밀접하게 관련되어 있는지 알려준다.

결정 계수 : 한 데이터 세트의 변동이 다른 데이터 세트로 설명될 수 있는 정도를 알려줍니다.

 

Q13. 나는 여전히 결정 계수와 상관 계수의 차이를 모릅니다. 초등학생이라고 생각하고 쉽게 설명해주실 수 있나요?

물론, 간단하게 설명하려고 노력할 것입니다.

상관 계수는 두 가지가 서로 얼마나 밀접하게 관련되어 있는지 측정하는 것과 같습니다. 범위는 -1에서 +1까지이며, -1은 완벽한 부정적인 관계(하나가 올라가면 다른 하나는 내려감)를 의미하고, +1은 완벽한 긍정적 관계(하나가 올라가면 다른 하나가 올라감)를 의미합니다.), 0은 둘 사이에 관계가 없음을 의미합니다.

 

결정 계수는 한 가지가 다른 것으로 얼마나 설명될 수 있는지를 측정하는 것과 같습니다. 범위는 0에서 1까지이며 단순히 상관 계수의 제곱입니다. 따라서 상관 계수가 0.8이면 결정 계수는 0.64(0.8의 제곱)입니다. 이것은 한 가지 변동의 64%가 다른 것으로 설명될 수 있음을 의미합니다.

 

따라서 상관 계수는 두 변수가 얼마나 밀접하게 관련되어 있는지 측정하는 도구인 반면

결정 계수는 한 변수가 다른 변수를 얼마나 잘 예측할 수 있는지 평가하는 도구입니다.

 

Q14. 아직도 나는 결정계수가 상관계수의 제곱이 되는 이유가 뭔지. 그리고 결정계수가 상관계수의 세제곱은 왜 안되는건지 아직도 모르겠어

 

물론, 더 쉬운 용어로 설명해 드리겠습니다!

상관 계수는 두 가지가 얼마나 밀접하게 관련되어 있는지 알려주는 숫자입니다. 우리는 그것을 사용하여 두 가지가 함께 위아래로 가는지 또는 반대 방향으로 가는지 확인합니다.

 

결정 계수는 우리가 다른 것(예: 얼마나 많이 먹는지)을 알고 있는 경우 하나(예: 키)를 얼마나 잘 예측할 수 있는지 측정하는 방법입니다. 우리가 알고 있는 다른 것으로 설명할 수 있는 예측 값과 실제 값의 차이 비율입니다.

 

결정 계수가 상관 계수의 제곱인 이유는 한 항목(예: 키)의 변동이 다른 항목(누군가 먹는 양)으로 설명되는 정도를 확인하는 데 도움이 되기 때문입니다. 상관 계수를 제곱하면 한 항목의 변동이 다른 항목으로 설명되는 비율을 알려주는 숫자를 얻습니다. 그것은 하나의 양을 그 자체로 곱하면 더 커지는 것과 같습니다.

 

상관 계수의 세제곱은 같은 것을 알려주지 않기 때문에 사용하지 않습니다. 제곱하면 한 가지의 변동이 다른 것으로 설명되는 정도를 알 수 있지만 세제곱하면 이 목적에 유용한 추가 정보를 제공하지 않습니다.

 

결정 계수가 상관 계수의 제곱인 이유는 제곱이 다른 변수에 의해 설명되는 한 변수의 총 변동 비율을 제공하기 때문입니다

 

요약 

상관계수 : 두 변수 간의 연관성

결정 계수 : 한 변수가 미치는 변동성

 

Q15. 그래도 상관 계수를 제곱하여 결정 계수를 얻을 수 있는 이유를 모르겠습니다.

결정 계수를 얻기 위해 상관 계수를 제곱한 뒤에 있는 아이디어는 상관 계수가 두 변수 사이의 선형 관계의 강도와 방향을 나타낸다는 것입니다. 상관 계수를 제곱하면 한 변수에서 다른 변수로 설명할 수 있는 변동의 비율을 얻습니다.

 

이를 이해하기 위해 완벽하게 선형적으로 관련된 두 개의 변수가 있다고 상상해보십시오.

즉, 한 변수의 값이 증가할 때마다 다른 변수의 값도 일정량만큼 증가합니다.

이 경우 상관 계수는 관계의 방향에 따라 1 또는 -1이 됩니다.

1 또는 -1의 상관 계수를 제곱하면 값이 1이 됩니다.

이는 한 변수의 변동을 다른 변수로 100% 설명할 수 있음을 의미합니다.

이는 두 변수가 완벽하게 선형적으로 관련되어 있기 때문입니다.

 

다른 경우에는 상관계수가 0과 1 사이일 때 결정계수도 0과 1 사이가 될 것이며, 이는 한 변수의 전체 변동 중 다른 변수로 설명될 수 있는 비율을 나타냅니다. 상관 계수가 0이면 두 변수 사이에 선형 관계가 없으며 결정 계수는 0이 됩니다.

따라서 상관계수를 제곱하여 결정계수를 구하는 것은 한 변수가 다른 변수에 의해 설명되는 변동의 비율을 선형 관계의 강도와 방향을 기준으로 측정하는 방법이다

 

Q16. 계속 상관 계수 제곱의 이유에 대해서

 

상관 계수는 두 변수가 얼마나 밀접하게 관련되어 있는지를 측정한 것입니다. 관계의 강도와 방향은 알려주지만 한 변수의 변동성이 다른 변수로 설명되는 비율은 알려주지 않습니다.

반면 결정 계수는 한 변수가 다른 변수에 의해 얼마나 잘 예측될 수 있는지를 측정한 것입니다. 그것은 다른 변수에 의해 설명되는 한 변수의 변동성의 비율을 알려줍니다.

 

그렇다면 결정 계수가 상관 계수의 제곱인 이유는 무엇입니까? 상관계수를 계산하는 방식 때문입니다. 상관 계수는 두 변수의 공분산을 취하여 표준 편차의 곱으로 나누어 계산합니다. 공분산은 두 변수가 함께 어떻게 변하는지를 측정하고 표준 편차는 각 변수가 자체적으로 얼마나 변하는지를 측정합니다.

 

상관 계수를 제곱할 때 기본적으로 표준 편차의 곱에 대한 공분산의 비율을 제곱합니다. 이 비율은 한 변수에서 다른 변수와 공유되는 변동성의 비율을 나타냅니다. 제곱하면 한 변수에서 다른 변수로 설명되는 전체 변동성의 비율을 알 수 있습니다.

요약하자면, 결정계수는 한 변수의 변동성이 다른 변수에 의해 설명되는 비율을 알려주기 때문에 상관계수의 제곱이며, 상관계수는 두 변수가 얼마나 가까운지를 측정한 것입니다. 관련된. 상관 계수를 제곱하면 설명되는 변동성의 비율을 측정할 수 있으며 이는 결정 계수입니다.

 

내가 이해한 방식 : 결정 계수는 예측 가능한 비율인 0과 1사이의 값으로 표현하기 위해서는 -1과 1 사이의 값을 표현하는 다음의 척도에서 제곱을 해줘야 -1이 아닌 예측 가능한 비율인 0과 1사이의 값으로 표현할 수 있기 때문에 상관계수에 제곱을 하는거라고 생각해. 맞니?

 

Q17. 상관 계수 제곱의 이유 정답!!!!

예측 방법 : 결정 계수는 예측 가능한 비율인 0과 1사이의 값으로 표현하기 위해서는 -1과 1 사이의 값을 표현하는 다음의 척도에서 제곱을 해줘야 -1이 아닌 예측 가능한 비율인 0과 1사이의 값으로 표현할 수 있기 때문에 상관계수에 제곱을 하는거라고 생각해. 맞니?

 

결과 : 예, 맞습니다. 결정 계수는 비율로 표현될 때 독립 변수(들)에 의해 설명될 수 있는 종속 변수의 분산 비율을 제공합니다. 항상 -1과 1 사이에 속하는 상관 계수를 제곱하면 항상 0과 1 사이의 비율을 얻게 되어 다른 계수와 해석하고 비교하기가 더 쉬워집니다.

 

* 결론

상관계수 : -1과 1사이

결정계수 : 0과 1사이 (한 변수가 다른 변수를 예측하기 위해서는 + 방향인 0과 1의 범위를 구해야 설득이 가능하기 때문)

결정계수가 0에 가깝다는 소리는 독립변수가 종속 변수에 영향을 미치지 않는다는 뜻이기 때문에

결국 결정계수가 높다는 사실은 두 변수 사이의 관계가 강하다는 뜻을 의미함.

 

Q18. 그렇다면 결정계수의 범위가 -1이 될 수 없는 이유는 이미 상관관계에서 정해지기 때문인거야?

예, 맞습니다. 결정계수는 한 변수의 변동이 다른 변수의 변동으로 얼마나 잘 설명되는지를 측정한 것입니다. 그것은 두 변수 사이의 선형 관계의 강도와 방향의 척도인 두 변수 사이의 상관관계에 의해 결정됩니다. 상관 계수는 -1과 1 사이의 값만 가질 수 있으므로 결정 계수(상관 계수의 제곱)는 0과 1 사이의 값만 가질 수 있습니다. 결정 계수 1은 한 변수는 다른 변수의 변동으로 설명할 수 있지만 결정 계수가 0이면 변수 간에 선형 관계가 없음을 의미합니다. 

결정 계수는 한 변수의 전체 분산 중 다른 변수에 의해 설명되는 비율로 정의 되기 때문에

변수의 분산 표현으로는 항상 양수라 음수가 될 수가 없음.

 

Q19. 약간 분산이 음수가 된다면 어떤 일이 생기는거야?

데이터 포인트와 데이터 세트의 평균 사이의 제곱 차이의 평균이기 때문에

차이를 구하는 식에서 음수가 나올 수는 없다.

그리고 데이터 분산은 데이터가 얼마나 분산되어 있는지를 나타내는 척도인데 일반적으로 음수만 포함된 데이터보다

정수의 데이터가 포함된 경우가 있기 때문에 차이를 구하면 무조건 정수로 출력될 수 밖에 없다.

* 분산을 구하는 식에서 제곱을 포함하기 때문에 음수를 곱하더라도 정수가 나온다. 따라서 절대 음수가 될 수 없다.

 

 

 

 

 

 

 

728x90
반응형
LIST