본문 바로가기

수업내용 정리

0228 만만한 통계 R 외부 챕터 8~9 정리 - 그래프 만들기, 데이터 분석 프로젝트

1. 질문

 

0228 만만한 통계 R 외부 챕터 8~9 질문 - 그래프 만들기, 데이터 분석 프로젝트

Q1.해당 코드에서 xlim과 ylim 값을 설정할 때 0이 들어가는 이유에 대해 설명해주세요. : midwest 변수. 이 코드에서 income은 종속 변수이고 sex는 독립 변수입니다. 두 번째 코드 t.test.formula(welfare $sex ~w

gurobig.tistory.com

2. 내용

 

0228 만만한 통계 R 외부 챕터 8~9 - 그래프 만들기, 데이터 분석 프로젝트

0 지난 시간 복습 범주형 : 빈도표 (이상치 확인 후 결측치로 바꾸기) 연속형(최소,최대,평균,중앙값) : 요악통계 1 그래프 만들기 CP 8 1) 그래프 종류 1 - 산점도 : 변수 사이의 상관 관계를 확인 -

gurobig.tistory.com

 

3. 정리

1) 오전

- 그래프 만들기

2) 오후

- 데이터 분석 프로젝트

 

* 핵심 (함수 정리)

- ggplot(data=a, aes(x=,y=)) + geom_~~ : 그래프 생성 함수

- geom_point : 산점도

- ylim(n1,n2) : n1부터 n2까지의 y축 범위 표현

- aes(x=,y=) : x,y축 데이터 지정

- options(scipen = 99) : 자릿수 지정 표현법 (기본적인)

- cor() : 상관계수

- cor.test() : 상관분석

- geom_col() : 막대 그래프 (이미 요약된 데이터를 통해 요약 통계 값을 나타낼 때)

ggplot(data=drv_hwy, aes(x=drv, y=hwy_mean))+
  geom_col()

- geom_bar() : 빈도 막대 그래프 (원시 형식의 데이터를 요약할 때 주로 사용)

ggplot(data = mpg, aes(x = drv))+
  geom_bar()

- xlab(" ") : x축 제목 설정

- geom_histogram(bins =10) : 구간수 10으로 설정하여 히스토그램 그래프 확인

- reorder(a,b) : b를 기준으로 a를 나타냄 (-b사용시 내림차순으로 정렬)

- geom_boxplot : 상자수염 그래프

- boxplot(mpg$hwy)$stats : 이상치 확인

- read.spss(경로, to.data.frame = T) : spss 형식의 데이터 불러오기

- rename(a=b) : 기존에 있는 b의 이름을 a로 변경

- geom_line() : 선형 그래프

- ifelse(조건, 부여, 조건2, 부여) : 조건식 부여

예시) ifelse(welfare$age < 30, "young",
                           ifelse(welfare$age < 60, "middle","old"))

-  scale_x_discrete(limits = c("a","b","c")) : x축의 이름 순서를 a,b,c로 조정

 

728x90
반응형
LIST