import
numpy as np
import
pandas as pd
import
matplotlib.pyplot as plt
data = pd.read_excel('
jiemo.xls
') #
匯入當前資料夾下的58.csv資料檔案
df=pd.dataframe(data)
df1=df.dropna()
df1['平方
']=df1['
平方'].str.replace("
㎡",""
)df1[
'**/每平方公尺
']=df1['
**']/df1['
平方'].astype(int)
d1=df1['位址']category =pd.categorical(d1)
from sklearn.preprocessing import
labelencoder
le =labelencoder()
le.fit(category)
d1=le.transform(d1)
price = df1['
**/每平方公尺']
adress =d1
plt.scatter(price, adress)
#x,y取值範圍設定
#可以過濾掉一部分髒資料
#設定title和x,y軸的label
plt.xlabel("
price")
plt.ylabel(
"adress")
plt.show()
d1=df1['位址']category =pd.categorical(d1)
from sklearn.preprocessing import
labelencoder
le =labelencoder()
le.fit(category)
d1=le.transform(d1)
(d1)
d2=df1['朝向'
]category =pd.categorical(d2)
le.fit(category)
d2=le.transform(d2)
(d2)
d3=df1['型別'
]category =pd.categorical(d3)
le.fit(category)
d3=le.transform(d3)
(d3)
target=
t2=feature=zip(d1,df1['平方'
].astype(int),d2,d3)
for i in df1['**'
].astype(int):
for i in
feature:
[186 163 187 ... 235 231 231][31 33 31 ... 33 31 33]
[17 17 5 ... 17 2 39]
from sklearn.neighbors importkneighborsclassifier
knn = kneighborsclassifier(n_neighbors=1)
knn.fit(t2,target)
knn.score(t2,target)
#0.8762793914246196
knn.predict([[167,80,2,2]])
python資料分析學習 KNN
knn k最鄰近分類演算法 1.knn相關介紹 如果乙個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某乙個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的乙個或者幾個樣本的類別來決定待分樣本所屬的類別。knn方法在類別決策時,只與極少量的相鄰樣本有關...
資料分析實戰 KNN手寫數字識別
1.演算法背景 2.sklearn介面api 3.手寫數字識別實戰 演算法背景 knn k nearest neighbor 演算法核心為 近朱者赤,近墨者黑 工作原理 1.計算待分類樣本與訓練樣本的距離 2.對距離公升序排序,選取距離待分類樣本最近的k個鄰居 3.分類 統計k個鄰居所屬的類別,並將...
資料分析之KNN數字識別手寫
import numpy as np bmp 字尾 import matplotlib.pyplot as plt matplotlib inline from sklearn.neighbors import kneighborsclassifier 提煉樣本資料 img arr plt.imre...