개발/머신러닝

파이썬. 머신러닝 - K-NN

웅'jk 2022. 12. 2. 13:15

K-NN 방식은 내 주위 데이터와의 거리로 어떠한 값에 가까운가를 학습하여 도출해내는

인공지능이다.

 

import pandas as pd

#read data
df =pd.read_csv('../data/Social_Network_Ads.csv')

#check null
df.isna().sum()

#set X,y
y = df['Purchased']
X = df.loc[:,['Age','EstimatedSalary']]

#feature scaling
from sklearn.preprocessing import MinMaxScaler
scaler_X = MinMaxScaler()
X = scaler_X.fit_transform(X)

# train / test
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=1)

# k-nn set
from sklearn.neighbors import KNeighborsClassifier
# 가장 가까운 5개 데이터로 분류 n_neighbors= default parameter 가 5 이다.
classifier = KNeighborsClassifier(n_neighbors=3)
classifier.fit(X_train,y_train)

# predict
y_pred = classifier.predict(X_test)

# 확인
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, y_pred)
from sklearn.metrics import accuracy_score
accuracy_score(y_test,y_pred)

위 사진 같은 형식으로 보여진다.