분류 전체보기 (260) 썸네일형 리스트형 0221 만만한 통계 R 질문 - 선형회귀, 단순회귀, 다중회귀 (18) Q1. 단순회귀분석과 다중회귀분석이 r studio에서 어떻게 구현되고 이들의 특징과 차이점이 빅데이터 의료산업에서 어떤 사례로 제시 되는지 알려줘 RStudio에서는 이 lm()함수를 사용하여 단순 선형 회귀를 수행할 수 있습니다. 예를 들어 두 개의 변수가 있는 데이터 세트가 x있고 에서 예측 하기 y위해 선형 회귀 모델을 맞추려고 한다고 가정해 보겠습니다 . 코드는 다음과 같습니다.yx model 0221 만만한 통계 R - 선형회귀, 단순회귀, 다중회귀 (18) CP18 선형회귀 1) 선형회귀 단순회귀분석 (simple regression) : 독립변수가 하나, 종속변수는 하나 다중회귀분석 (multiple regression) : 독립변수가 2개 이상, 종속변수는 하나 - 회귀분석 : 오차를 가장 적게 만들어주는 선을 찾는 것을 의미함. (오차가 줄어야 예측하기가 쉬우니) - 독립변수 = X변수 - 종속변수 = Y변수 최적선 : 주어진 데이터 셋의 데이터에 가장 잘 맞는 라인 회귀선 : 데이터 세트에서 두 변수 간의 관계를 추정하는데 사용되는 직선 (독립 변수 값을 기반으로 종속 변수 값을 예측) 예측 오차 : 종속 변수의 예측 값과 데이터 세트에서 실제 관찰된 값 간의 차이 2) 절편과 기울기 기울기 : X편차*Y편차합 / X편차제곱합 (X분산이 들어가는 이.. 0220 만만한 통계 R 정리 - 상관계수 계산 및 유의성 검정, 보건의료(7,17) 1. 질문 0220 만만한 통계 R 질문 - 상관계수 계산 및 유의성 검정, 보건의료(7,17) Q1.상관계수가 0.4라면 큰 수치인가요? 상관 계수의 크기는 맥락과 연구 분야에 따라 다릅니다. 그러나 0.4의 상관 계수는 두 변수 사이에 적당한 양의 관계가 있음을 나타냅니다. 일반적으로 상관 gurobig.tistory.com 2. 내용 0220 만만한 통계 R - 상관계수 계산 및 유의성 검정, 보건의료(7,17) C7 상관계수 계산하기 1) 상관관계 상관계수 : 기술통계 값의 범위는 -1 gurobig.tistory.com 3. 정리 1) 오전 - 상관관계 2) 오후 - 상관관계 유의성 검정 * 핵심 - 상관계수, 유의성 검정은 중요하다. - 산점도분석은 변수가 증가함에 따라 다양한 방법으로 함수를.. CP7,CP17 문제 풀이 CP7 Q1. A # Q1 - A data 0220 만만한 통계 R 질문 - 상관계수 계산 및 유의성 검정, 보건의료(7,17) Q1.상관계수가 0.4라면 큰 수치인가요? 상관 계수의 크기는 맥락과 연구 분야에 따라 다릅니다. 그러나 0.4의 상관 계수는 두 변수 사이에 적당한 양의 관계가 있음을 나타냅니다. 일반적으로 상관계수가 -0.3~0.3이면 약한 관계, -0.7~-0.3 또는 0.3~0.7이면 중간 정도, -0.7보다 작거나 0.7보다 크면 강한 상관관계를 나타낸다. Q2. 상관 계수를 처음 배울 때 좋은 질문이 무엇인지 말씀해 주시겠습니까? 상관 계수는 무엇이며 무엇을 측정합니까? 상관 계수는 어떻게 계산됩니까? 상관 계수에 대해 가능한 값의 범위는 무엇입니까? 상관 계수의 크기와 방향을 어떻게 해석합니까? 양의 상관 관계와 음의 상관 관계의 차이점은 무엇입니까? 변수 간의 관계를 식별하기 위해 상관 계수를 어떻게 사용.. 0220 만만한 통계 R - 상관계수 계산 및 유의성 검정, 보건의료(7,17) C7 상관계수 계산하기 1) 상관관계 상관계수 : 기술통계 값의 범위는 -1 CP9 ~ CP11 문제 풀이 (수정중) CP9 가설 검정 Q1.논문 다섯 편 선택 후 다음 질문에 대답 A 귀무가설에 대해 이야기 1) 전처리 음식재료 사용이 학교급식 생산성 및 소비자 만족도에 미치는 영향 x 2) 주거환경 취약지역에 대한 도시재생 뉴딜사업의 실태분석 연령과 마을 생활환경 만족도의 경우 유의수준이 F=0.683 p= 0.0637로 유 의수준에 0.05 기준으로 통계적으로 유의하지 않게 나타났다. 따라서 귀무가설이 채택, 되어 ‘거주형태별 두 집단 간에는 마을 생활환경 만족도 점수 차이가 없다’고 할 수 있다. 그러나 경제활동 비율이 매우 낮고, 전체 표본 중 102개 이상이 60대 이상의 집단임으로 고령화가 매우 심각한 지역임을 인지하여야 한다. 3) 베이커리 소비자의 라이프스타일, 지각된 서비스품질,고객가치와 행동의도 간의.. CP 3 ~ CP 5 문제 풀이 질문 Q1. 포함 범위에 1을 추가한 이유를 모르겠습니다. 포함 범위에는 최소값과 최대값이 모두 포함되므로 두 값의 차이를 고려하여 1을 더해야 합니다. 예를 들어 최소값이 3이고 최대값이 12.1이면 그 차이는 9.1입니다. 그러나 3과 12.1이 모두 범위에 포함되므로 포함 범위를 얻으려면 1을 더해야 합니다. 즉, 9.1 + 1 = 10.1입니다. 반면 배타적 범위는 최소값과 최대값 사이의 값만 포함하므로 계산을 위해 1을 더할 필요가 없습니다. CP12 ~ CP15 문제 풀이(수정중) CP 12 단일 표본 Z 검정 305P CP 13 독립 표본 T 검정 324P Q1. 남학생 평균 : 7.93 여학생 평균 : 5.31 t.test 결과 p값 : 0.0055 t값 : 3.007 귀무가설 기각에 대한 0.05 유의수준의 임계값은 1.702 따라서 유의하다. Q2. CP 14 독립 표본 T 검정 324P CP 15 ANOVA 분산 분석 362P 0217 만만한 통계 R 질문 - 평균 차이 검정, 분산분석(ANOVA)(14,15) Q1. ANOVA 분석에서 검정통계량을 계산할 때 특징을 알려줄래? 그리고 다른 식들과 어떤 연관 있는지도 알려줘 (분산식과 같은) ANOVA(분산 분석)는 세 개 이상의 데이터 그룹의 평균을 비교하는 데 사용되는 통계적 방법입니다. ANOVA 테스트는 그룹 평균이 서로 유의하게 다른지 여부를 평가하기 위해 F-통계량을 사용합니다. F-통계량은 그룹 간 변동성을 그룹 내 변동성으로 나누어 계산합니다. ANOVA에서 검정 통계량은 그룹 간 변동성과 그룹 내 변동성의 비율을 기반으로 합니다. ANOVA 분석에서 검정 통계량 계산의 특징은 다음과 같습니다. 검정 통계량은 그룹 간 분산과 그룹 내 분산의 두 가지 분산 비율을 기반으로 합니다. 검정은 그룹 간 평균의 차이가 다음과 같은지 확인하기 위해 고안되었습.. 이전 1 ··· 15 16 17 18 19 20 21 ··· 26 다음