전체 글 175

Aws MySql Setting

Aws Mysql free tier 설치 방법입니다. 포털사이트에 aws 입력하시고 회원가입을 진행합니다. 그 다음 데이터베이스 생성을 누르시고 Mysql 셋팅 free tier 버전으로 설정합니다. 그 뒤로 다른 거 건들이지 마시고 학습용이기때문에 퍼블릭을 설정합니다. 암호부분에는 본인이 사용할 password 입력합니다. 그리고 생성하시면 aws 기본세팅이 완료됩니다. 그 다음으로는 aws 에서 방화벽을 해제해주셔야 합니다. 서비스 - 데이터베이스 - RDS 항목으로 갑니다. 그 다음 RDS - 데이터베이스 - 여러분이 생성하신 DB로 넘어갑니다. 그다음 연결 보안 항목에서 보안을 선택합니다. 그 다음 인바운드 규칙편집을 통해 여러분들이 사용하실 SQL 워크벤치를 등록합니다. 지금은 mysql wor..

개발/SQL 2022.12.05

파이썬. 머신러닝 - Hierarchical_clusterning

모든 데이터들의 길이를 구하고 가장 짧은 길이를 가진 데이터끼리를 묶는 과정을 계속 반복하여 한덩어리가 될때 멈추는 기법이다. 처음에는 모든 길이를 다구한다. 가장 짧은 길이의 데이터를 한덩어리로 묶고 다시 과정을 반복한다. 이러한 과정을 거쳐 한덩어리가 되었을 때 멈추고 이 과정을 Dendrogram 으로 나타내어 눈으로 확인하여 군집을 몇개로 나눌지 확인한다. import scipy.cluster.hierarchy as sch # X = 데이터프레임에서 분할에 이용할 데이터 sch.dendrogram(sch.linkage(X,method = 'ward')) plt.title('Dendrogram') plt.xlabel('Customers') plt.ylabel('Euclidean Distances')..

개발/머신러닝 2022.12.05

파이썬. 머신러닝 - K-means, Elbow Method

Kmeans 는 unsupervised learning 이다 지금까지는 문제 - 결과를 통해 학습한 내용으로 결과를 도출해냈다면 이제는 결과가 없는 문제만 가지고 쌩으로 도출해내야한다. 그 방법 중 하나로 kmeans 방식으로 임의의 값을 주어지고 구역을 나눠 그 구역안에 값들의 평균을 구해 값을 재지정하여 데이터의 이동을 파악하는 방식이다. 위 사진처럼 빨간점 , 푸른점 을 임의로 두고 두 값의 기울기가 90도인 선을 그어 구역을 나눈뒤 구역별 데이터의 평균을 구한 뒤 또다시 그 두 값의 기울기로 구역을 나눈다. 이러한 과정을 계속 반복하여 데이터의 이동이 없을 때 구역을 확정 짓고 결과값을 내놓게 된다. # set lib import numpy as np import pandas as pd impor..

개발/머신러닝 2022.12.02

파이썬. 머신러닝 - Decision Tree, Random Forest

Decision Tree 는 선택을 계속하는 기법입니다. 특정 조건이 주어졌을때 yes 또는 no 로 분기점을 내고 이러한과정을 반복합니다. # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # data read df = pd.read_csv('../data/Social_Network_Ads.csv') # set x y X = df.iloc[:,[2,3]] y=df['Purchased'] # feature scaling from sklearn.preprocessing import MinMaxScaler scaler_X = MinMaxScaler() X=scaler_X.fit_tran..

개발/머신러닝 2022.12.02

파이썬.머신러닝 - Grid Search

그리드 서치란 ? 인공지능을 학습을 시킬때 어떤 학습법이 더 좋은지 찾아내는 방법이다. param_grid = {'kernel':['linear','rbf','poly'] , 'C' : [0.1,1,10], 'gamma':[0.01,0.1,1] } # kernel은 모델, c 와 gamma 는 조절 수치이다. from sklearn.model_selection import GridSearchCV grid = GridSearchCV(SVC() , param_grid , refit=True, verbose=4) grid.fit(X_train,y_train) #최고의 인공지능 grid.best_estimator_ #최고의 값 grid.best_params_ #학습중최고적중률 grid.best_score_

개발/머신러닝 2022.12.02

파이썬. 머신러닝 - Support Vector Machine

SVM 은 구분하기 어려운 데이터들을 나타낼때 효과적이다. # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd #read data df= pd.read_csv('../data/Social_Network_Ads.csv') #set X y X = df.iloc[0:,[2,3]] y = df['Purchased'] #feature scaling from sklearn.preprocessing import MinMaxScaler scaler_X = MinMaxScaler() X= scaler_X.fit_transform(X) #train/test from sklearn.model_select..

개발/머신러닝 2022.12.02

파이썬. 머신러닝 - K-NN

K-NN 방식은 내 주위 데이터와의 거리로 어떠한 값에 가까운가를 학습하여 도출해내는 인공지능이다. import pandas as pd #read data df =pd.read_csv('../data/Social_Network_Ads.csv') #check null df.isna().sum() #set X,y y = df['Purchased'] X = df.loc[:,['Age','EstimatedSalary']] #feature scaling from sklearn.preprocessing import MinMaxScaler scaler_X = MinMaxScaler() X = scaler_X.fit_transform(X) # train / test from sklearn.model_selection ..

개발/머신러닝 2022.12.02

파이썬. 머신러닝 - 의미없는 데이터 , 데이터의 불균형 처리방법(Up Sampling)

간혹 데이터값이 NaN은 아니지만 의미가 없는 자료로 있는 경우가 있습니다. 위와 같은 데이터가 있습니다. 그런데 class를 제외한 컬럼의 0값이 있는걸 확인 할 수 있습니다. 이 컬럼들은 0인 값은 의미가 없어서 인공지능을 만들어 학습하는데 안좋은 영향을 줄 수도 있습니다. 따라서 이 값들을 처리를 해주셔야합니다. import numpy as np df.loc[:,'Plas':'age']=df.loc[:,'Plas':'age'].replace(0,np.nan) # 1. NaN을 없애고, 인공지능 개발 df = df.dropna() # 2. 다른 값으로 채우는 방법 df.fillna(df.mean(),inplace=True) 위 코드는 먼저 0값들을 NaN으로 바꾼 뒤 다시 가공한 방법입니다. 2가지 ..

개발/머신러닝 2022.12.02

파이썬. 머신러닝 - Logistic Regression

이번에는 머신러닝 기법 중 하나인 Logistic Regression 을 알아봅시다. 이 기법은 분류에 사용됩니다. ex) 나이대별로 이메일을 클릭해서 열지 말지를 분류해 보자 클릭(1) , 논클릭(0) 데이터를 가져와 물건을 구매할지(1) 안할지 (0)으로 분류하여 예측하는 인공지능을 만들어 봅시다, # import import numpy as np import matplotlib.pyplot as plt import pandas as pd # read data df = pd.read_csv('../data/Social_Network_Ads.csv') # data check unique df['Purchased'].unique() # X 설정 y 설정 X = df.loc[:,['Age','Estimat..

개발/머신러닝 2022.12.01

파이썬. 머신러닝 - 내가 만든 Linear Regression으로 예측하기, joblib으로 저장

먼저 다시 한번 더 Linear Regression 을 학습하는 방법에 대해 알아봅시다. 1. 학습할 데이터를 가져옵니다. 2. 데이터의 NaN 값 여부를 확인 - NaN값이 존재할 경우 처리. 3. 예측할 컬럼을 y, 예측에 이용할 컬럼을 X축으로 둡니다. 4. X축 자료에 카테고리컬 데이터의 문자가 있다면, Encoding 을 통해 숫자로 바꿔줍니다. 없다면 그냥 사용하시면 됩니다. - 1~2 개 -> label , 3 개이상 , One-Hot https://mokokodevelop.tistory.com/45 5. X의 데이터를 Traing , Test 로 나눕니다. https://mokokodevelop.tistory.com/47 6. 인공지능을 이용해 학습을 시작합니다. -ex) LinearReg..

개발/머신러닝 2022.12.01