0228 만만한 통계 R 외부 챕터 8~9 정리 - 그래프 만들기, 데이터 분석 프로젝트
1. 질문
0228 만만한 통계 R 외부 챕터 8~9 질문 - 그래프 만들기, 데이터 분석 프로젝트
Q1.해당 코드에서 xlim과 ylim 값을 설정할 때 0이 들어가는 이유에 대해 설명해주세요. : midwest 변수. 이 코드에서 income은 종속 변수이고 sex는 독립 변수입니다. 두 번째 코드 t.test.formula(welfare $sex ~w
gurobig.tistory.com
2. 내용
0228 만만한 통계 R 외부 챕터 8~9 - 그래프 만들기, 데이터 분석 프로젝트
0 지난 시간 복습 범주형 : 빈도표 (이상치 확인 후 결측치로 바꾸기) 연속형(최소,최대,평균,중앙값) : 요악통계 1 그래프 만들기 CP 8 1) 그래프 종류 1 - 산점도 : 변수 사이의 상관 관계를 확인 -
gurobig.tistory.com
3. 정리
1) 오전
- 그래프 만들기
2) 오후
- 데이터 분석 프로젝트
* 핵심 (함수 정리)
- ggplot(data=a, aes(x=,y=)) + geom_~~ : 그래프 생성 함수
- geom_point : 산점도
- ylim(n1,n2) : n1부터 n2까지의 y축 범위 표현
- aes(x=,y=) : x,y축 데이터 지정
- options(scipen = 99) : 자릿수 지정 표현법 (기본적인)
- cor() : 상관계수
- cor.test() : 상관분석
- geom_col() : 막대 그래프 (이미 요약된 데이터를 통해 요약 통계 값을 나타낼 때)
ggplot(data=drv_hwy, aes(x=drv, y=hwy_mean))+
geom_col()
- geom_bar() : 빈도 막대 그래프 (원시 형식의 데이터를 요약할 때 주로 사용)
ggplot(data = mpg, aes(x = drv))+
geom_bar()
- xlab(" ") : x축 제목 설정
- geom_histogram(bins =10) : 구간수 10으로 설정하여 히스토그램 그래프 확인
- reorder(a,b) : b를 기준으로 a를 나타냄 (-b사용시 내림차순으로 정렬)
- geom_boxplot : 상자수염 그래프
- boxplot(mpg$hwy)$stats : 이상치 확인
- read.spss(경로, to.data.frame = T) : spss 형식의 데이터 불러오기
- rename(a=b) : 기존에 있는 b의 이름을 a로 변경
- geom_line() : 선형 그래프
- ifelse(조건, 부여, 조건2, 부여) : 조건식 부여
예시) ifelse(welfare$age < 30, "young",
ifelse(welfare$age < 60, "middle","old"))
- scale_x_discrete(limits = c("a","b","c")) : x축의 이름 순서를 a,b,c로 조정