본문 바로가기

수업내용 정리

(77)
공공데이터 with 샤이니 4~5 정리 - 데이터 전처리, 지오 코딩 1. 질문 x 2. 내용 공공데이터 with 샤이니 4~5 - 데이터 전처리, 지오 코딩 1. 데이터 전처리 CP 4 1) 실습 : 형태 변환 후 파일 저장 # 300개 csv 파일 생성 됨. # 파일만 가져옴 filenames gurobig.tistory.com 3. 정리 1) 오전 - 데이터 전처리 2) 오후 - 지오 코딩 API * 핵심 - 한글을 바로 쓸 수 없어서 디코드를 엔코딩 해줘야 함
공공데이터 with 샤이니 1~3 정리 - 데이터 분석가, API 크롤링 1. 질문 공공데이터 with 샤이니 1 질문 - 데이터 분석가, API 크롤링 Q1.r studio에서 nchar 함수와 legth 함수의 차이는 뭐야 nchar 함수는 문자열의 길이를 측정하는 함수입니다. 예를 들어, "Hello"라는 문자열은 5개의 문자로 이루어져 있으므로 nchar(“Hello”)는 5를 반환 gurobig.tistory.com 2. 내용 공공데이터 with 샤이니 1 - 데이터 분석가, API 크롤링 0. 목차분석 1) 목차 목차는 간단하게 확인 1. 데이터 분석가 1) 개념 - 데이터 엔지니어 DE : 수집 -> 저장 - 데이터 분석가 DA : 분석 -> 시각화 2) 데이터 분석 프로젝트 5단계 (문제정의 -> 데이터 수 gurobig.tistory.com 3. 정리 1) 오..
0304 sqld 특강 0. sqld에서 data라고 하는 것이 무엇인지 커피 쇼핑몰 : 회원가입, 로그인, 구매, 장바구니 1. 데이터에 대한 이해 1) 데이터에 대한 이해 - 데이터 : cpu에 저장된 2진수로 된 자료들 - 파일형태 : 블럭(레코드)형태로 저장 되어 있음 - 실행 속도의 차이 : 디스크 > cpu (디스크가 ram에 저장함) - irg : 레코드와 레코드의 갭 - ibg : 블럭과 블럭의 갭 - 관계형 데이터 베이스는 파일 형태의 구조를 바꾼 것 2) 파일 형태의 한계점 - 찾을 때마다 끝까지 찾으니 오래 걸림. 따라서 테이블 형태의 구조가 생기게 됨. 3) 테이블 형태의 데이터 구조 & DBMS - 테이블 형태는 행을 2개 이상의 값을 필요로 함 - 논리적 스키마 (개념적 모델링) = 테이블 형태의 데이..
0302 만만한 통계 R 외부 챕터 9~10 정리 - 데이터 분석 프로젝트 2, 텍스트 마이닝 1. 질문 x 2. 내용 0302 만만한 통계 R 외부 챕터 9~10 - 주제에 따른 분석 기법을 통한 문제 실습, 텍스트 마이닝 0. 지난 시간 복습 1) 핵심 통계를 하는 이유는 유의성 검정을 위해 (제대로 된 분석인지) 1. 나이 및 성별 월급 차이 분석하기 1) 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 3월2일 # 다섯번 gurobig.tistory.com 3. 정리 1) 오전 - 데이터 분석 프로젝트 2 2) 오후 - 텍스트 마이닝 * 핵심 - 데이터 마이닝 사용방법 알아둘 것. - 주제 제시에 따라 어떤 분석 기법을 사용할지 예상하고 그에 따른 변수값 구하는 것을 순서대로 생각하고 코딩할 것.
0303 만만한 통계 R 외부 챕터 11~14 정리 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R markdown 1. 질문 x 2. 내용 0303 만만한 통계 R 외부 챕터 11~14 정리 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R 1. 지도 시각화 (CP 11) 1) 데이터 파악 # 지도시각화 = 단계구분도 choropleth map # map projection install.packages("mapproj") install.packages("ggiraphExtra") library(mapproj) library(ggiraphExtra) # 미국 주별 범죄 데이터 = 내 gurobig.tistory.com 3. 정리 1) 오전 - 지도 시각화, 인터랙티브 그래프 2) 오후 - 통계분석 가설 검정, R markdown * 핵심 (함수) library(mapproj) : ggplot()과 geo..
0228 만만한 통계 R 외부 챕터 8~9 정리 - 그래프 만들기, 데이터 분석 프로젝트 1. 질문 0228 만만한 통계 R 외부 챕터 8~9 질문 - 그래프 만들기, 데이터 분석 프로젝트 Q1.해당 코드에서 xlim과 ylim 값을 설정할 때 0이 들어가는 이유에 대해 설명해주세요. : midwest 변수. 이 코드에서 income은 종속 변수이고 sex는 독립 변수입니다. 두 번째 코드 t.test.formula(welfare $sex ~w gurobig.tistory.com 2. 내용 0228 만만한 통계 R 외부 챕터 8~9 - 그래프 만들기, 데이터 분석 프로젝트 0 지난 시간 복습 범주형 : 빈도표 (이상치 확인 후 결측치로 바꾸기) 연속형(최소,최대,평균,중앙값) : 요악통계 1 그래프 만들기 CP 8 1) 그래프 종류 1 - 산점도 : 변수 사이의 상관 관계를 확인 - guro..
0227 만만한 통계 R 외부 챕터 6~8 정리 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 1. 질문 0227 만만한 통계 R 외부 챕터 6~8 질문 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 Q1. 통합 연비를 구하기 위해 여기서 나누기 2를 해주는 이유가 뭐야? mutate(total = (hwy + cty)/2) %>% : mpg %>% filter(class == "suv") %>% mutate(total = (hwy + cty)/2) %>% group_by(manufacturer) %>% summarise(mean_total = mean(total gurobig.tistory.com 2. 내용 0227 만만한 통계 R 외부 챕터 6~8 - 데이터 추출, 데이터 합치기, 데이터 정제, 그래프 0. 지난 시간 복습 시간 # 지난 시간 복습 exam 파이프라인 기호의 유무 차이..
0224 만만한 통계 R 외부 챕터 4~6 정리 - 데이터 프레임, 데이터 분석, 데이터 가공 1. 질문 0223 만만한 통계 R 외부 챕터 15 질문 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 Q1. as.data.frame(ggplot2::mpg)와 data.frame(ggplot2::mpg) 의 차이가 뭐야? as.data.frame(ggplot2:mpg)와 의 차이점은 data.frame(ggplot2:mpg)데이터를 데이터 프레임으로 변환하는 방식에 있습니다. as.data.frame(ggplot2:mpg)mp gurobig.tistory.com 2. 내용 0224 만만한 통계 R 외부 챕터 4~6 - 데이터 프레임, 데이터 분석, 데이터 가공 1. 외부 챕터 4~5 (데이터 프레임, 데이터 분석 기초) 1) 실습 (csv파일 저장 및 불러오기) # Q1 apple %..
0223 만만한 통계 R 외부 챕터 15 정리 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 1. 질문 0223 만만한 통계 R 외부 챕터 15 질문 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 Q1. as.data.frame(ggplot2::mpg)와 data.frame(ggplot2::mpg) 의 차이가 뭐야? as.data.frame(ggplot2:mpg)와 의 차이점은 data.frame(ggplot2:mpg)데이터를 데이터 프레임으로 변환하는 방식에 있습니다. as.data.frame(ggplot2:mpg)mp gurobig.tistory.com 2. 내용 0223 만만한 통계 R 외부 챕터 15 - 내장 함수, 변수 타입과 데이터 구조 // 기초 문제 연습 15 R 내장함수, 변수 타입과 데이터 구조 1) 연속형 변수 (빈도 분석) 연속형 변수 (숫자) : 평균, 표..
0222 만만한 통계 R - 카이제곱 검정과 기타 비모수 검정 (CP19) 1. 질문 0222 만만한 통계 R 질문 - 카이제곱 검정과 기타 비모수 검정 (CP19) Q1. 비모수 통계와 모수 통계에 대해서 각각 설명하고 차이점을 알려줄래? 모수통계란 데이터가 정규분포를 이루고 평균, 표준편차 등의 매개변수를 알고 있다고 가정하는 통계의 일종이다. 이 gurobig.tistory.com 2. 내용 0222 만만한 통계 R - 카이제곱 검정과 기타 비모수 검정 (CP19) PART 6 CP19 1) 단일표본 카이제곱 검정 - 독립성검정 : 두 변수와 관련이 있는지 여부 확인 (야채를 먹는 것과 건강이 관련이 있는가) - 동질성검정 : 두 개 이상의 그룹이 서로 유사하거나 다른지 확 gurobig.tistory.com 3. 정리 1) 오전 - 독립성 카이제곱 검정 2) 오후 - 적..

728x90
반응형