分類
評價標準
精確率–以二分類為例,在測試樣本集上,**結果:
正例**為正類(tp),負例**為正類(fp)。如, a–>a(tp正確**),b–>a(fp錯誤**)
p=\franctp
tp+f
p
負例**為負類(tn),正例**為負類(fn)。如, b–>b(tn正確**),a–>b(fn錯誤**) p=
\franctn
tn+f
n
召回率–針對原來的樣本而言,表示樣本中**正確的正例有多少
原來的正例**為正類(tp),原來的正例**為負類(fn) p=
\franctp
tp+f
n
準確率–**正確/所有樣本 p=
\franctp
+tnt
p+fp
+tn+
fnsklearn分類庫
sklearn庫中的分類演算法放在不同的子模組中,主要包括:
k近鄰
樸素貝葉斯
支援向量機
決策樹
神經網路模型 …回歸
回歸定義
了解兩個或多個變數間是否相關、研究其相關方向與強度,並建立數學模型以便觀察特定變數;
回歸分析幫助人們了解在自變數變化時因變數的變化量;
適合對帶有時序資訊的資料進行**或趨勢擬合(如金融領域、交通資料)
sklearn回歸庫
sklearn.linear_model–>線性回歸函式–>
普通線性回歸
嶺回歸
lasso
非線性回歸–>
多項式回歸
sklearn.preprocessing子模組
## 例項說明 ##
對感測器採集的大量資料分析與建模,通過各項特徵的數值進行使用者狀態的判斷,根據使用者所處的狀態提供給使用者更加精準、便利的服務
## 資料介紹 ##
abcde 使用者可穿戴裝置的感測器資料,資料集包括:特徵檔案(a.feature)標籤檔案(a.label)
特徵檔案:每行–乙個時刻的所有感測器數值
標籤檔案:每行–與特徵檔案對應時刻,標記過的使用者姿態
兩檔案行數相同,相同行之間互相對應
41列特徵
溫度資料
反映活動劇烈程度:
靜止狀態時,溫度穩定在36.5度上下;
高於37度時,可能為短時間劇烈運動
加速度資料
兩個型號加速度感測器,互相印證,保證完整性和準確性
加速度感測器對應的三個數值,xyz三個軸上對應的加速度
陀螺儀資料
角運動檢測常用資料,判斷身體角度水平、傾斜、垂直
磁場資料
使用者周圍磁場強度和數值大小,幫助理解使用者周圍環境
磁場改變,使用者的位置和場景發生變化
每行代表與特徵檔案中對應行的使用者姿態類別,共25種
標籤檔案作為訓練集的標準參考準則,可以進行特徵的監督學習
## 任務介紹 ##
1.出現新使用者,如何根據感測器資料,判斷使用者狀態?
2.同一使用者,根據當前資料,判斷新資料的使用者狀態?
Python機器學習應用 Kmeans演算法
import numpy as np from sklearn.cluster import kmeans def loaddata filepath fr open filepath,r 讀寫開啟乙個文字檔案 lines fr.readlines retdata 城市各個消費資料 retcityn...
python機器學習基礎(二)
python機器學習基礎教程 一 k近鄰演算法scikit learn中有很多可用的分類演算法。這裡我們用的是k近鄰分類器,這是乙個很容易理解的演算法。核心思想是 要對乙個新的資料點作出 演算法會在訓練集中尋找與這個新資料點距離最近的資料點,然後將找到的資料點的標籤賦值給這個新資料點。k近鄰演算法中...
Python機器學習基礎(二)
什麼是監督學習?當我們希望通過某些輸入來 對應的輸出,這時候就需要先使用已經存在的輸入 輸出資料對來訓練模型,這些資料對中,每乙個輸入都乙個已知的輸出,我們就是讓機器去學習這其中的規律 基本介紹 監督學習問題主要分為兩種 分類與回歸 分類問題 類別標籤。比如在 一 中實現的鳶尾花分類 回歸問題 乙個...