python資料分析學習 KNN

2021-10-17 16:13:50 字數 1658 閱讀 3478

knn(k最鄰近分類演算法)

1.knn相關介紹: 如果乙個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某乙個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的乙個或者幾個樣本的類別來決定待分樣本所屬的類別。knn方法在類別決策時,只與極少量的相鄰樣本有關。由於knn方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對於類域的交叉或重疊較多的待分樣本集來說,knn 方法較其他方法更為適合。

```python

#2.knn**示例,該**可以判斷電影是愛情片還是動作片

import numpy as np

from sklearn import neighbors

knn = neighbors.kneighborsclassifier()

data = np.array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]]) #分別代表打鬥次數和接吻次數

labels = np.array([1,1,1,2,2,2])#1、2分別代表愛情片和動作片

knn.fit(data,labels)

knn.predict([[18,90]])

array([1])

import numpy as np

from sklearn import neighbors

knn = neighbors.kneighborsclassifier()

data = np.array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]]) #分別代表打鬥次數和接吻次數

labels = np.array([1,1,1,2,2,2])#1、2分別代表愛情片和動作片

knn.fit(data,labels)

knn.predict([[90,18]])

array([2])

import numpy as np

from sklearn import neighbors

knn = neighbors.kneighborsclassifier()

data = np.array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]]) #分別代表打鬥次數和接吻次數

labels = np.array([1,1,1,2,2,2])#1、2分別代表愛情片和動作片

knn.fit(data,labels)

knn.predict([[90,1]])

array([2])

import numpy as np

from sklearn import neighbors

knn = neighbors.kneighborsclassifier()

data = np.array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]]) #分別代表打鬥次數和接吻次數

labels = np.array([1,1,1,2,2,2])#1、2分別代表愛情片和動作片

knn.fit(data,labels)

knn.predict([[2,98]])

array([1])

租房資料分析,knn演算法使用

import numpy as np import pandas as pd import matplotlib.pyplot as plt data pd.read excel jiemo.xls 匯入當前資料夾下的58.csv資料檔案 df pd.dataframe data df1 df.dr...

python資料分析學習路線

python是一種物件導向 直譯式計算機程式語言,由guido van rossum於1989年底發明。由於他簡單 易學 免費開源 可移植性 可擴充套件性等特點,python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,python受歡迎程度扶搖直上。用python玩轉資料 由於pytho...

Python資料分析 Pandas學習

dataframe是乙個類似於 的資料型別,如圖 data 方框內的資料 numpy ndarray structured or homogeneous dict,or dataframe index 行索引索引 index or array like columns 列索引 index or ar...