標籤:我們要**的真實事物:y。基本線性回歸中的y變數。
特徵:用於描述資料的輸入變數:xi。基本線性回歸中的變數
樣本:資料的特定例項x0
有標籤樣本:同時包含特徵和標籤,我們使用有標籤樣本來訓練模型。
無標籤樣本:包含特徵但不包含標籤,用於對新資料作出**。
模型:定義了特徵與標籤之間的關係,可將樣本對映到**標籤:y』。由模型的內部引數定義,這些內部引數值是通過學習得到的
訓練:建立或學習模型
推斷:將訓練後的模型應用於無標籤樣本
回歸:回歸模型可**連續值
分類:分類模型可**離散值
l2損失=平方誤差=(觀測值-**值)^2
=(y-y『)^2
線性關係
y』=b+w1x1
y』指的是**標籤(理想輸出值)。
b指的是偏差(y 軸截距)。而在一些機器學習文件中,它稱為 w0。
w1 指的是特徵 1 的權重。權重與上文中用 m 表示的「斜率」的概念相同。
x1 指的是特徵(已知輸入項)。
訓練模型表示通過有標籤樣本來學習(確定)所有權重和偏差的理想值。在監督式學習中,機器學習演算法通過以下方式構建模型:檢查多個樣本並嘗試找出可最大限度地減少損失的模型;這一過程稱為經驗風險最小化.
mse均方誤差
機器學習 演算法 GG
機器學習 真實值為1 真實值為0 為1 tpfp 為0 fntn tp true positive tp 樣本為正,結果為正 fp 樣本為負,結果為正 tn 樣本為負,結果為負 fn 樣本為正,結果為負。準確率 精準率和召回率的計算公式如下 準確率 accuracy tp tn tp fp tn f...
Python學習筆記 12 10章 XML
1 概覽 xml雖然比json複雜,在web中應用也不如以前多了,不過仍有很多地方在用,所以,有必要了解如何操作xml。1 dom vs sax 操作xml有兩種方法 dom和sax。dom會把整個xml讀入記憶體,解析為樹,因此占用記憶體大,解析慢,優點是可以任意遍歷樹的節點。sax是流模式,邊讀...
機器學習學習筆記
2.機器學習書籍 機器學習tom,這個是老經典,就是翻譯欠佳 prml,這個書正版的超貴,但是比較新且系統,可以通過其他途徑搞個副本。3.自己動手編碼實現2 3種經典演算法,比如svm,lr,bpnn等。4.了解spark上目前支援的機器學習方法的用途和用法,這個在日常工作中會用到。知道的多一點,方...