본문 바로가기

배운 책들 정리

(80)
공공데이터 with 샤이니 데이터 분석 프로젝트 - 문제 정의 1 1. 문제 정의 정보 수집
공공데이터 with 샤이니 12_2 - 샤이니 app 활용 사례 (커피 전문점 접근성) 1. 샤이니 app 활용 사례 : 커피 전문점 접근성 분석하기 1) 라이브러리 불러오기 load("./data/coffee/coffee_shop.rdata") head(coffee_shop, 2) library(shiny);library(leaflet);library(leaflet.extras);library(dplyr) 2) ui 구현하기 ui
공공데이터 with 샤이니 12 - 샤이니 app 활용 사례 (지진 발생 분석) 1. 샤이니 app 활용 사례 1) 라이브러리, 지진 데이터 불러오기 # 지진 발생 분석 웹 어플리케이션 개발 # 0315_12_app3.R # 데이터 준비 load("./data/earthquake/earthquake_16_21.rdata") head(quakes) # sn 연번, year 연도, month 월, day 일, mag 진도, depth 깊이, lat 위도, lon 경도, location 위치 library(shiny);library(leaflet);library(ggplot2);library(ggpmisc) # install.packages(c("shiny","leaflet","ggplot2","ggpmisc")) # ui # bootstrapPage(): html,css,js 기능을 쉽..
공공데이터 with 샤이니 9,10 - 샤이니 입문하기, 데이터 분석 app 개발하기 1. 샤이니 입문하기 CP 9 1) 샤이니 기본 구조 # # 01 # 샤이니 기본 구조 # install.packages("shiny") library(shiny) # ui ui
공공데이터 with 샤이니 7,8 - 분석 주제를 지도로 시각화하기, 통계 분석과 시각화 1. 분석 주제를 지도로 시각화하기 CP 7 1) 우리 동네가 옆 동네보다 비쌀까? : 데이터 불러오기 # 3. 우리 동네가 옆 동네보다 비쌀까? # 특정 지역의 평균 가격을 주변 지역과 비교 # 평당 가격(py) 평균 값을 모든 지도에 표시 # 마커스 클러스터링 = 지도에 표시되는 마커가 너무 많을 때, 특정한 기준으로 하나의 클러스터로 묶어주는 방법 # 데이터 불러오기 ----- # 데이터 준비 # 아파트 가격 load("./data/apt_price.rdata") head(apt_price) # 최고가 레스터 데이터 load("./data/apt_high.rdata") head(apt_high) # 급등한 지역 레스터 데이터 load("./data/apt_hot.rdata") head(apt_hot..
공공데이터 with 샤이니 6,7 - 지오 데이터 프레임, 분석 주제를 지도로 시각화하기 1. 지오 데이터 프레임 CP 6 1) 전처리한 주소 데이터 + 지오 코딩 데이터 (경도, 위도 = 좌표) 합치기 // 결측치 제거까지 # 지오 데이터프레임 # 전처리 완료한 데이터 불러오기 apt_price
공공데이터 with 샤이니 4~5 - 데이터 전처리, 지오 코딩 1. 데이터 전처리 CP 4 1) 실습 : 형태 변환 후 파일 저장 # 300개 csv 파일 생성 됨. # 파일만 가져옴 filenames
공공데이터 with 샤이니 1~3 - 데이터 분석가, API 크롤링 0. 목차분석 1) 목차 목차는 간단하게 확인 1. 데이터 분석가 1) 개념 - 데이터 엔지니어 DE : 수집 -> 저장 - 데이터 분석가 DA : 분석 -> 시각화 2) 데이터 분석 프로젝트 5단계 (문제정의 -> 데이터 수집 -> 전처리 -> 분석과 시각화 -> 서비스구현과 운용) 문제 정의 : 계획 (주제선정, 어떤데이터, 분석방법, 시각화) 데이터 수집 : 저장 // 자료원 전처리 : 이상치, 결측치, 중복 등 (데이터 질, 신뢰성) 분석과 시각화 : 통계분석 등(머신러닝 등) // 어떤 변수를 표현하고 어떤 종류로 나타낼 것인지 (시각화에 필요한) 서비스 구현과 운용 : 웹 어플리케이션 개발 및 배포 * 데이터 분석에서는 데이터 수집, 전처리가 50%임. 2. 자료 수집 전에 알아야 할 내용 1..
0303 만만한 통계 R 외부 챕터 11~14 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R markdown 1. 지도 시각화 (CP 11) 1) 데이터 파악 # 지도시각화 = 단계구분도 choropleth map # map projection install.packages("mapproj") install.packages("ggiraphExtra") library(mapproj) library(ggiraphExtra) # 미국 주별 범죄 데이터 = 내장 데이터 str(USArrests) head(USArrests) # 현재 데이터의 행 이름이 주 이름 # 주 이름을 열로 변환 library(tidyverse) crime
0302 만만한 통계 R 외부 챕터 9~10 - 데이터 분석 프로젝트 2, 텍스트 마이닝 0. 지난 시간 복습 1) 핵심 통계를 하는 이유는 유의성 검정을 위해 (제대로 된 분석인지) 1. 나이 및 성별 월급 차이 분석하기 1) 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 3월2일 # 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 1. 나이와 성별에 따른 월급 차이가 있는가? # 2. 나이와 성별, 월급 변수 검토 # 3. 나이와 성별, 월급의 관계 분석 # 변수 검토는 앞선 분석에서 모두 완료하였음 # 나이와 성별에 따른 평균 월급 데이터가 필요함 age_sex_income % filter(!is.na(income)) %>% group_by(age,sex) %>% summarise(income_mean = mean(income)) age_sex_income # 나이와 성별에..

728x90
반응형