본문 바로가기

수업내용 정리

0227 만만한 통계 R 외부 챕터 6~8 정리 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프

1. 질문

 

0227 만만한 통계 R 외부 챕터 6~8 질문 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프

Q1. 통합 연비를 구하기 위해 여기서 나누기 2를 해주는 이유가 뭐야? mutate(total = (hwy + cty)/2) %>% : mpg %>% filter(class == "suv") %>% mutate(total = (hwy + cty)/2) %>% group_by(manufacturer) %>% summarise(mean_total = mean(total

gurobig.tistory.com

2. 내용

 

0227 만만한 통계 R 외부 챕터 6~8 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프

0. 지난 시간 복습 시간 # 지난 시간 복습 exam 파이프라인 기호의 유무 차이 # 예) 수학 점수 library(tidyverse) exam$math exam %>% select(math) # 데이터 살펴보기 head(exam,10) exam %>% head(10) tail(exam) exam %>% tail() h

gurobig.tistory.com

3. 정리

1) 오전

-데이터 추출, 데이터 합치기

2) 오후

- 데이터 정제, 그래프

 

* 핵심

~순으로 = group by // cty 평균 // 높은지
NA 제거

 

- group_by는 항상 앞에서 그룹 이야기를 꺼낼 때 자주 사용한다. // ~~~in

- summarise에서 변수를 카운팅하는 횟수인 n()는 변수를 카운팅 해준다.

- merge 함수가 정렬을 할 때 범용성 있게 쓰인다.

- 평균을 구할 때 NA제거 (na.omit(df))는 통계 오류를 범할 수 있기 때문에 잘써야 한다.

 

728x90
반응형
LIST