본문 바로가기

분류 전체보기

(260)
공공데이터 with 샤이니 4~5 정리 - 데이터 전처리, 지오 코딩 1. 질문 x 2. 내용 공공데이터 with 샤이니 4~5 - 데이터 전처리, 지오 코딩 1. 데이터 전처리 CP 4 1) 실습 : 형태 변환 후 파일 저장 # 300개 csv 파일 생성 됨. # 파일만 가져옴 filenames gurobig.tistory.com 3. 정리 1) 오전 - 데이터 전처리 2) 오후 - 지오 코딩 API * 핵심 - 한글을 바로 쓸 수 없어서 디코드를 엔코딩 해줘야 함
공공데이터 with 샤이니 4~5 - 데이터 전처리, 지오 코딩 1. 데이터 전처리 CP 4 1) 실습 : 형태 변환 후 파일 저장 # 300개 csv 파일 생성 됨. # 파일만 가져옴 filenames
공공데이터 with 샤이니 1~3 정리 - 데이터 분석가, API 크롤링 1. 질문 공공데이터 with 샤이니 1 질문 - 데이터 분석가, API 크롤링 Q1.r studio에서 nchar 함수와 legth 함수의 차이는 뭐야 nchar 함수는 문자열의 길이를 측정하는 함수입니다. 예를 들어, "Hello"라는 문자열은 5개의 문자로 이루어져 있으므로 nchar(“Hello”)는 5를 반환 gurobig.tistory.com 2. 내용 공공데이터 with 샤이니 1 - 데이터 분석가, API 크롤링 0. 목차분석 1) 목차 목차는 간단하게 확인 1. 데이터 분석가 1) 개념 - 데이터 엔지니어 DE : 수집 -> 저장 - 데이터 분석가 DA : 분석 -> 시각화 2) 데이터 분석 프로젝트 5단계 (문제정의 -> 데이터 수 gurobig.tistory.com 3. 정리 1) 오..
공공데이터 with 샤이니 1~3 - 데이터 분석가, API 크롤링 0. 목차분석 1) 목차 목차는 간단하게 확인 1. 데이터 분석가 1) 개념 - 데이터 엔지니어 DE : 수집 -> 저장 - 데이터 분석가 DA : 분석 -> 시각화 2) 데이터 분석 프로젝트 5단계 (문제정의 -> 데이터 수집 -> 전처리 -> 분석과 시각화 -> 서비스구현과 운용) 문제 정의 : 계획 (주제선정, 어떤데이터, 분석방법, 시각화) 데이터 수집 : 저장 // 자료원 전처리 : 이상치, 결측치, 중복 등 (데이터 질, 신뢰성) 분석과 시각화 : 통계분석 등(머신러닝 등) // 어떤 변수를 표현하고 어떤 종류로 나타낼 것인지 (시각화에 필요한) 서비스 구현과 운용 : 웹 어플리케이션 개발 및 배포 * 데이터 분석에서는 데이터 수집, 전처리가 50%임. 2. 자료 수집 전에 알아야 할 내용 1..
공공데이터 with 샤이니 1~3 질문 - 데이터 분석가, API 크롤링 Q1.r studio에서 nchar 함수와 legth 함수의 차이는 뭐야 nchar 함수는 문자열의 길이를 측정하는 함수입니다. 예를 들어, "Hello"라는 문자열은 5개의 문자로 이루어져 있으므로 nchar(“Hello”)는 5를 반환합니다. length 함수는 벡터의 길이를 측정하는 함수입니다. 예를 들어, c(“Hello”, “World”)라는 벡터는 2개의 원소로 이루어져 있으므로 length(c(“Hello”, “World”))는 2를 반환합니다 Q2. paste0 함수에 대해 알려줘 paste0 함수는 R에서 문자열을 이어붙이는 함수입니다
sqld 1일차 궁금한거 시각화 1. 식별자
0304 sqld 특강 0. sqld에서 data라고 하는 것이 무엇인지 커피 쇼핑몰 : 회원가입, 로그인, 구매, 장바구니 1. 데이터에 대한 이해 1) 데이터에 대한 이해 - 데이터 : cpu에 저장된 2진수로 된 자료들 - 파일형태 : 블럭(레코드)형태로 저장 되어 있음 - 실행 속도의 차이 : 디스크 > cpu (디스크가 ram에 저장함) - irg : 레코드와 레코드의 갭 - ibg : 블럭과 블럭의 갭 - 관계형 데이터 베이스는 파일 형태의 구조를 바꾼 것 2) 파일 형태의 한계점 - 찾을 때마다 끝까지 찾으니 오래 걸림. 따라서 테이블 형태의 구조가 생기게 됨. 3) 테이블 형태의 데이터 구조 & DBMS - 테이블 형태는 행을 2개 이상의 값을 필요로 함 - 논리적 스키마 (개념적 모델링) = 테이블 형태의 데이..
0304 sqld 특강 질문 1. 데이터 모델링에서 SCSI가 뭐야 SCSI(Small Computer System Interface)는 컴퓨터와 하드 디스크 드라이브, 테이프 드라이브 및 CD/DVD 드라이브와 같은 주변 장치 간에 데이터를 물리적으로 연결하고 전송하기 위한 일련의 표준입니다. 데이터 모델링에서 SCSI는 일반적으로 저장 장치와 이에 액세스하는 시스템 간의 물리적 연결 및 데이터 전송 프로토콜을 모델링하는 방법으로 사용됩니다. SCSI 모델은 SAN(Storage Area Network)을 설계 및 최적화하고 데이터 백업 및 복구 전략을 계획하는 데 사용할 수 있습니다. 2. 클러스터링에 대해 알려줄래? 클러스터링은 데이터 분석에서 유사한 데이터 요소나 개체를 함께 그룹화하는 데 사용되는 기술입니다. 클러스터링의 ..
0302 만만한 통계 R 외부 챕터 9~10 정리 - 데이터 분석 프로젝트 2, 텍스트 마이닝 1. 질문 x 2. 내용 0302 만만한 통계 R 외부 챕터 9~10 - 주제에 따른 분석 기법을 통한 문제 실습, 텍스트 마이닝 0. 지난 시간 복습 1) 핵심 통계를 하는 이유는 유의성 검정을 위해 (제대로 된 분석인지) 1. 나이 및 성별 월급 차이 분석하기 1) 다섯번째 주제 : 나이와 성별에 따른 월급의 차이 # 3월2일 # 다섯번 gurobig.tistory.com 3. 정리 1) 오전 - 데이터 분석 프로젝트 2 2) 오후 - 텍스트 마이닝 * 핵심 - 데이터 마이닝 사용방법 알아둘 것. - 주제 제시에 따라 어떤 분석 기법을 사용할지 예상하고 그에 따른 변수값 구하는 것을 순서대로 생각하고 코딩할 것.
0303 만만한 통계 R 외부 챕터 11~14 정리 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R markdown 1. 질문 x 2. 내용 0303 만만한 통계 R 외부 챕터 11~14 정리 - 지도 시각화, 인터랙티브 그래프, 통계분석 가설 검정, R 1. 지도 시각화 (CP 11) 1) 데이터 파악 # 지도시각화 = 단계구분도 choropleth map # map projection install.packages("mapproj") install.packages("ggiraphExtra") library(mapproj) library(ggiraphExtra) # 미국 주별 범죄 데이터 = 내 gurobig.tistory.com 3. 정리 1) 오전 - 지도 시각화, 인터랙티브 그래프 2) 오후 - 통계분석 가설 검정, R markdown * 핵심 (함수) library(mapproj) : ggplot()과 geo..

728x90
반응형