본문 바로가기

분류 전체보기

(260)
0303 만만한 통계 R 외부 챕터 11~14 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R markdown 1. 지도 시각화 (CP 11) 1) 데이터 파악 # 지도시각화 = 단계구분도 choropleth map # map projection install.packages("mapproj") install.packages("ggiraphExtra") library(mapproj) library(ggiraphExtra) # 미국 주별 범죄 데이터 = 내장 데이터 str(USArrests) head(USArrests) # 현재 데이터의 행 이름이 주 이름 # 주 이름을 열로 변환 library(tidyverse) crime
부산 맛집 정보 부산 여행하는 사람들을 중심으로 맛집을 알려드리기 위해 간단하게 글을 쓰게 되었습니다. 미식 여행을 하기 전 앞서 알아야 할 정보는 3가지입니다. 1. 부산 음식의 역사 2. 지리에 따른 음식 정보 3. 맛집 정보들 1. 부산 음식의 역사 부산 음식의 역사의 키워드로 3가지를 뽑자면 다음을 뽑을 수 있습니다. 1) 피난민들의 도시 : 돼지국밥 2) 항구 도시의 대표적인 특성 '음식 문화의 용광로' : 만두, 어묵 3) 따뜻한 지역의 음식 특성 : 튀김과 밀가루를 사용한 음식들 (밀면, 떡볶이) 1) 피난민들의 도시 : 돼지국밥 흔히 저희가 알고 있는 돼지국밥은 6.25 전쟁 당시 다양한 피난민들이 부산으로 모여 살게 되었고 이 때 이북에서 내려온 사람들에 의해 이북식 돼지국밥이 전파 되었습니다. (물론 ..
0302 만만한 통계 R 외부 챕터 9~10 - 데이터 분석 프로젝트 2, 텍스트 마이닝 0. 지난 시간 복습 1) 핵심 통계를 하는 이유는 유의성 검정을 위해 (제대로 된 분석인지) 1. 나이 및 성별 월급 차이 분석하기 1) 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 3월2일 # 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 1. 나이와 성별에 따른 월급 차이가 있는가? # 2. 나이와 성별, 월급 변수 검토 # 3. 나이와 성별, 월급의 관계 분석 # 변수 검토는 앞선 분석에서 모두 완료하였음 # 나이와 성별에 따른 평균 월급 데이터가 필요함 age_sex_income % filter(!is.na(income)) %>% group_by(age,sex) %>% summarise(income_mean = mean(income)) age_sex_income # 나이와 성별에..
0228 만만한 통계 R 외부 챕터 8~9 정리 - 그래프 만들기, 데이터 분석 프로젝트 1. 질문 0228 만만한 통계 R 외부 챕터 8~9 질문 - 그래프 만들기, 데이터 분석 프로젝트 Q1.해당 코드에서 xlim과 ylim 값을 설정할 때 0이 들어가는 이유에 대해 설명해주세요. : midwest 변수. 이 코드에서 income은 종속 변수이고 sex는 독립 변수입니다. 두 번째 코드 t.test.formula(welfare $sex ~w gurobig.tistory.com 2. 내용 0228 만만한 통계 R 외부 챕터 8~9 - 그래프 만들기, 데이터 분석 프로젝트 0 지난 시간 복습 범주형 : 빈도표 (이상치 확인 후 결측치로 바꾸기) 연속형(최소,최대,평균,중앙값) : 요악통계 1 그래프 만들기 CP 8 1) 그래프 종류 1 - 산점도 : 변수 사이의 상관 관계를 확인 - guro..
0228 만만한 통계 R 외부 챕터 8~9 질문 - 그래프 만들기, 데이터 분석 프로젝트 Q1.해당 코드에서 xlim과 ylim 값을 설정할 때 0이 들어가는 이유에 대해 설명해주세요. : midwest 변수. 이 코드에서 income은 종속 변수이고 sex는 독립 변수입니다. 두 번째 코드 t.test.formula(welfare $sex ~welfare$income, var.equal = T)는 또한 income 변수와 sex 변수를 기반으로 두 그룹의 평균을 비교합니다. 그러나 이 코드에서 sex는 종속 변수이고 income은 독립 변수입니다. 따라서 두 코드는 서로 다른 가설을 테스트하고 있습니다. 첫 번째 코드는 남녀 간 평균 소득 차이가 있는지 테스트하고 두 번째 코드는 소득 수준 간 평균 성별 차이가 있는지 테스트합니다. * 이해 : 구하고자 하는 값은 성별과 월급의 관계 분석인..
0228 만만한 통계 R 외부 챕터 8~9 - 그래프 만들기, 데이터 분석 프로젝트 0 지난 시간 복습 범주형 : 빈도표 (이상치 확인 후 결측치로 바꾸기) 연속형(최소,최대,평균,중앙값) : 요악통계 1 그래프 만들기 CP 8 1) 그래프 종류 1 - 산점도 : 변수 사이의 상관 관계를 확인 - 히스토그램 (연속형 변수) : 단일 변수의 분포를 보여주는 그래프. (데이터 모양과 산포를 식별하는데 도움이 됨) (데이터를 간격으로 나눠 그래프의 막대는 각 간격의 관측치 수를 나타냄) - 선그래프 : 시간 또는 기타 연속 간격에 따른 두 변수 간의 관계를 보여줌. 데이터 추세 또는 패턴을 파악하는데 용이함. (시간 경과에 따라 데이터가 어떻게 변하는지) - 상자수염그림 : 단일 변수의 데이터 범위, 중앙값, 사분위수 범위(IQR)을 보여줌. 상자는 중앙값을 나타냄.위스커는 데이터의 최소값과..
0227 만만한 통계 R 외부 챕터 6~8 정리 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 1. 질문 0227 만만한 통계 R 외부 챕터 6~8 질문 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 Q1. 통합 연비를 구하기 위해 여기서 나누기 2를 해주는 이유가 뭐야? mutate(total = (hwy + cty)/2) %>% : mpg %>% filter(class == "suv") %>% mutate(total = (hwy + cty)/2) %>% group_by(manufacturer) %>% summarise(mean_total = mean(total gurobig.tistory.com 2. 내용 0227 만만한 통계 R 외부 챕터 6~8 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 0. 지난 시간 복습 시간 # 지난 시간 복습 exam 파이프라인 기호의 유무 차이..
0227 만만한 통계 R 외부 챕터 6~8 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 0. 지난 시간 복습 시간 # 지난 시간 복습 exam 파이프라인 기호의 유무 차이 # 예) 수학 점수 library(tidyverse) exam$math exam %>% select(math) # 데이터 살펴보기 head(exam,10) exam %>% head(10) tail(exam) exam %>% tail() head(exam$science) exam %>% select(science) %>% head # 행 추출 exam[exam$class == 1,] exam %>% filter(class == 1) # 열 추출 exam[,"math"] exam[,c("math","science")] exam %>% select(math) exam %>% select(math,science) # 행과 열을 ..
0227 만만한 통계 R 외부 챕터 6~8 질문 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 Q1. 통합 연비를 구하기 위해 여기서 나누기 2를 해주는 이유가 뭐야? mutate(total = (hwy + cty)/2) %>% : mpg %>% filter(class == "suv") %>% mutate(total = (hwy + cty)/2) %>% group_by(manufacturer) %>% summarise(mean_total = mean(total)) %>% head(5) 우리가 통합 연비를 계산하는 이유는 서로 다른 차량의 연비를 비교하기 위해서입니다. 도심 연비와 고속도로 연비는 따로 측정하는데 자동차의 총 연비를 알고자 합니다. 따라서 도시와 고속도로의 연비를 합산하고 2로 나누어 평균을 구합니다. 이것은 우리에게 자동차의 전체 연비를 나타내는 단일 숫자를 제공합니다. 2로 나누..
0224 만만한 통계 R 외부 챕터 4~6 정리 - 데이터 프레임, 데이터 분석, 데이터 가공 1. 질문 0223 만만한 통계 R 외부 챕터 15 질문 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 Q1. as.data.frame(ggplot2::mpg)와 data.frame(ggplot2::mpg) 의 차이가 뭐야? as.data.frame(ggplot2:mpg)와 의 차이점은 data.frame(ggplot2:mpg)데이터를 데이터 프레임으로 변환하는 방식에 있습니다. as.data.frame(ggplot2:mpg)mp gurobig.tistory.com 2. 내용 0224 만만한 통계 R 외부 챕터 4~6 - 데이터 프레임, 데이터 분석, 데이터 가공 1. 외부 챕터 4~5 (데이터 프레임, 데이터 분석 기초) 1) 실습 (csv파일 저장 및 불러오기) # Q1 apple %..

728x90
반응형