파이썬 머신러닝 판다스 데이터 분석 7-3 - 머신러닝 데이터 분석 - 시그모이드 함수의 식, 로지스틱 회귀, 교차검증
1. 군집분석 1) KMC * 데이터 탐색 * 데이터 분할 / 모형 학습 객체 생성 * 클러스터 라벨 넘버 확인 * 클러스터 넘버에 색깔 부여해서 시각화 # %% # 시각화 df.plot(kind="scatter", x="Fresh", y="Milk", c="cluster_no",cmap = "hsv") df.plot(kind="scatter", x="Grocery", y="Frozen", c="cluster_no",cmap = "hsv") * 엘보 방법 # %% # 엘보 방법 d = [] for i in range(1,10+1): kmc_i = cluster.KMeans(n_clusters=i, random_state=1) kmc_i.fit(X) d.append(kmc_i.inertia_) plt.pl..
파이썬 머신러닝 판다스 데이터 분석 5,6 - 데이터 사전 처리, 데이터프레임의 다양한 응용
5장 데이터 사전 처리 1. 범주형 데이터 처리 * 범주형 데이터 처리 # %% # 범주형(카테고리) 데이터 처리 # 데이터 구간 분할 import pandas as pd import numpy as np df=pd.read_csv(r'/content/drive/MyDrive/BDA/part4/auto-mpg.csv', header=None) df.columns = ["mpg","cylinders","displacement","horsepower", "weight","acceleration","model year","origin","name"] # horsepower 열의 누락 데이터("?")를 삭제하고 실수형으로 변환 df["horsepower"].replace("?",np.nan, inplace=Tr..
파이썬 머신러닝 판다스 데이터 분석 3,4 - 데이터 살펴보기, 시각화
3장 데이터 살펴보기 1. 데이터프레임 1) 데이터 내용 미리보기 #데이터 살펴보기 ##데이터 프레임의 구조 ###데이터 내용 미리보기 #1 # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 df = pd.read_csv(r"/content/drive/MyDrive/BDA/part3/auto-mpg.csv", header=None) print(df) # 열 이름 지정 df.columns = ["mpg", "cylinders", "displacement","horsepower", "weight", "accleration","model year","origin","name"] # 기본값이 행 5개 # 데이터 앞부분 print(df.head()) # 데이터 뒷부분 print('\n..