본문 바로가기

분류 전체보기

(260)
0224 만만한 통계 R 외부 챕터 4~6 질문 - 데이터 프레임, 데이터 분석, 데이터 가공 Q1. 어떤 뜻인지 쉽게 설명해줄 수 있어? mpg %>% group_by(manufacturer,drv) %>% mutate(hwy_mean = mean(hwy)) 이 코드는 먼저 이 두 변수를 기반으로 데이터의 하위 집합을 만드는 함수를 사용하여 데이터 mpg를 그룹화합니다. 그런 다음 함수 를 사용하여 이러한 각 하위 집합에 대한 변수 의 평균을 계산 하고 결과 값을 이라는 새 열에 할당합니다 . 연산자 는 코드를 더 쉽게 읽고 이해할 수 있도록 파이프라인에서 이러한 작업을 함께 연결하는 데 사용됩니다.
0224 만만한 통계 R 외부 챕터 4~6 - 데이터 프레임, 데이터 분석, 데이터 가공 1. 외부 챕터 4~5 (데이터 프레임, 데이터 분석 기초) 1) 실습 (csv파일 저장 및 불러오기) # Q1 apple % filter(class %in% c(1,3,5)) %>% select(english,science) %>% head(3) # 기본값 = 6개 행 보기 exam %>% filter(class %in% c(1,3,5)) %>% select(english,science) %>% head exam %>% filter(class %in% c(1,3,5)) %>% select(english,science) %>% head() 6) 문제풀기 (filter, select 사용) # mpg 데이터를 이용해서 분석 문제를 해결해보세요. # • Q1. mpg 데이터는 11 개 변수로 구성되어 있습니..
0223 만만한 통계 R 외부 챕터 15 정리 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 1. 질문 0223 만만한 통계 R 외부 챕터 15 질문 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 Q1. as.data.frame(ggplot2::mpg)와 data.frame(ggplot2::mpg) 의 차이가 뭐야? as.data.frame(ggplot2:mpg)와 의 차이점은 data.frame(ggplot2:mpg)데이터를 데이터 프레임으로 변환하는 방식에 있습니다. as.data.frame(ggplot2:mpg)mp gurobig.tistory.com 2. 내용 0223 만만한 통계 R 외부 챕터 15 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 15 R 내장함수, 변수 타입과 데이터 구조 1) 연속형 변수 (빈도 분석) 연속형 변수 (숫자) : 평균, 표..
0223 만만한 통계 R 외부 챕터 15 질문 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 Q1. as.data.frame(ggplot2::mpg)와 data.frame(ggplot2::mpg) 의 차이가 뭐야? as.data.frame(ggplot2:mpg)와 의 차이점은 data.frame(ggplot2:mpg)데이터를 데이터 프레임으로 변환하는 방식에 있습니다. as.data.frame(ggplot2:mpg)mpg함수를 사용하여 패키지 의 데이터를 ggplot2데이터 프레임으로 변환합니다 as.data.frame(). 이 함수는 원본 데이터의 구조를 유지하고 데이터 프레임으로 변환하려고 시도합니다. data.frame(ggplot2:mpg)또한 mpg데이터를 데이터 프레임으로 변환하지만 함수를 사용하여 처음부터 새 데이터 프레임을 만듭니다. data.frame(). 이 함수는 벡터나 리스..
0223 만만한 통계 R 외부 챕터 15 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 15 R 내장함수, 변수 타입과 데이터 구조 1) 연속형 변수 (빈도 분석) 연속형 변수 (숫자) : 평균, 표준편차 -> SUMMARY() -> 차이검정(독립표본T검정) 2) 범주형 변수 (카이제곱) 범주형 변수 (그룹/문자) : 빈도, 비율 -> TABLE() -> 카이제곱 검정 3) 실습 1 (행추출) # 내장함수 # 데이터 준비하기 exam 행번호, 행이름, 열번호, 열이름 # 인덱스 사용법:데이터[행,열] # 행 추출 exam[1,] exam[15,] exam[c(1:10),] exam[c(11:20),] 2) 실습2 (이름으로 추출까지) exam[seq(1,20,by=2),] exam[seq(0,20,by=2),] # 조건을 만족하는 행 추출 str(exam) # 같다 exam[exam$cla..
0222 만만한 통계 R - 카이제곱 검정과 기타 비모수 검정 (CP19) 1. 질문 0222 만만한 통계 R 질문 - 카이제곱 검정과 기타 비모수 검정 (CP19) Q1. 비모수 통계와 모수 통계에 대해서 각각 설명하고 차이점을 알려줄래? 모수통계란 데이터가 정규분포를 이루고 평균, 표준편차 등의 매개변수를 알고 있다고 가정하는 통계의 일종이다. 이 gurobig.tistory.com 2. 내용 0222 만만한 통계 R - 카이제곱 검정과 기타 비모수 검정 (CP19) PART 6 CP19 1) 단일표본 카이제곱 검정 - 독립성검정 : 두 변수와 관련이 있는지 여부 확인 (야채를 먹는 것과 건강이 관련이 있는가) - 동질성검정 : 두 개 이상의 그룹이 서로 유사하거나 다른지 확 gurobig.tistory.com 3. 정리 1) 오전 - 독립성 카이제곱 검정 2) 오후 - 적..
CP18 ~ CP19 문제풀이 CP18 Q1) 분산분석과 선형회귀의 차이점 분산분석은 데이터의 분포를 통해 가설에 대한 유의 확률을 찾는 반면 선형회귀는 독립변수의 값이 종속변수에 미칠 가능성을 찾는 것의 차이점이 있다. Q2) a) 추측 횟수 바탕 / 응답시간 예측 # 회귀방정식 yhat = bx + a # 절편(예측변수) + 기울기 회귀방정식 정답 : -0.2141(예측변수) + 17.2021 b) 추측 횟수 8일 / 예측된 응답 시간 -0.2141(8) + 17.2021 = 15.4893 c) 예측치 구하기 (예측된 응답시간 - 실제 응답 시간) # Load the necessary library library(tidyverse) # Read in the dataset data
0222 만만한 통계 R - 카이제곱 검정과 기타 비모수 검정 (CP19) PART 6 CP19 1) 단일표본 카이제곱 검정 - 독립성검정 : 두 변수와 관련이 있는지 여부 확인 (야채를 먹는 것과 건강이 관련이 있는가) - 동질성검정 : 두 개 이상의 그룹이 서로 유사하거나 다른지 확인하기 위함 (서로 다른 반의 학생들 성적이 비슷한지) - 적합성 검정 : 데이터 샘플이 특정 분포를 가진 모집단에 나온 것인지 확인 (학생 표본이 전체 학교 인구를 대표하는지) - 단일표본 카이제곱 검정 :범주형 변수의 관측 빈도를 기대 빈도와 비교하는 통계 검정을 의미함. 범주형 데이터 분포가 모두 동일할 경우 예상되는 분포와 다른가요의 질문과 같음 예측 빈도와 관측 빈도를 비교하는 방법 (예측과 실제 실험 시 차이가 있는지) 2) 카이제곱 검정통계량 카이제곱 검정통계량 식 : x^2 = su..
0222 만만한 통계 R 질문 - 카이제곱 검정과 기타 비모수 검정 (CP19) Q1. 비모수 통계와 모수 통계에 대해서 각각 설명하고 차이점을 알려줄래? 모수통계란 데이터가 정규분포를 이루고 평균, 표준편차 등의 매개변수를 알고 있다고 가정하는 통계의 일종이다. 이러한 통계를 사용하려면 인구 분포의 모양을 알고 해당 정보를 사용하여 인구에 대해 추론해야 합니다. 파라메트릭 통계의 예로는 t-테스트, ANOVA 및 선형 회귀가 있습니다. 반면 비모수 통계는 모집단 분포나 모수에 대한 가정이 필요하지 않습니다. 이러한 통계는 데이터가 정규 분포를 따르지 않거나 샘플 크기가 작을 때 사용됩니다. 비모수 통계는 추론을 위해 실제 값이 아닌 데이터 순위를 사용하는 데 중점을 둡니다. 비모수 통계의 예로는 Wilcoxon 부호 순위 테스트, Kruskal-Wallis 테스트 및 Mann-Wh..
0221 만만한 통계 R 정리 - 선형회귀, 단순회귀, 다중회귀 (18) 1. 질문 0221 만만한 통계 R 질문 - 선형회귀, 단순회귀, 다중회귀 (18) Q1. 단순회귀분석과 다중회귀분석이 r studio에서 어떻게 구현되고 이들의 특징과 차이점이 빅데이터 의료산업에서 어떤 사례로 제시 되는지 알려줘 RStudio에서는 이 lm()함수를 사용하여 단순 선형 gurobig.tistory.com 2. 내용 0221 만만한 통계 R - 선형회귀, 단순회귀, 다중회귀 (18) CP18 선형회귀 1) 선형회귀 단순회귀분석 (simple regression) : 독립변수가 하나, 종속변수는 하나 다중회귀분석 (multiple regression) : 독립변수가 2개 이상, 종속변수는 하나 - 회귀분석 : 오차를 가장 적 gurobig.tistory.com 3. 정리 1) 오전 - 선..

728x90
반응형