K-NN 방식은 내 주위 데이터와의 거리로 어떠한 값에 가까운가를 학습하여 도출해내는
인공지능이다.
import pandas as pd
#read data
df =pd.read_csv('../data/Social_Network_Ads.csv')
#check null
df.isna().sum()
#set X,y
y = df['Purchased']
X = df.loc[:,['Age','EstimatedSalary']]
#feature scaling
from sklearn.preprocessing import MinMaxScaler
scaler_X = MinMaxScaler()
X = scaler_X.fit_transform(X)
# train / test
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=1)
# k-nn set
from sklearn.neighbors import KNeighborsClassifier
# 가장 가까운 5개 데이터로 분류 n_neighbors= default parameter 가 5 이다.
classifier = KNeighborsClassifier(n_neighbors=3)
classifier.fit(X_train,y_train)
# predict
y_pred = classifier.predict(X_test)
# 확인
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, y_pred)
from sklearn.metrics import accuracy_score
accuracy_score(y_test,y_pred)
위 사진 같은 형식으로 보여진다.
'개발 > 머신러닝' 카테고리의 다른 글
파이썬.머신러닝 - Grid Search (0) | 2022.12.02 |
---|---|
파이썬. 머신러닝 - Support Vector Machine (0) | 2022.12.02 |
파이썬. 머신러닝 - 의미없는 데이터 , 데이터의 불균형 처리방법(Up Sampling) (0) | 2022.12.02 |
파이썬. 머신러닝 - Logistic Regression (0) | 2022.12.01 |
파이썬. 머신러닝 - 내가 만든 Linear Regression으로 예측하기, joblib으로 저장 (0) | 2022.12.01 |