ML 機器學習基礎

2021-09-11 11:35:49 字數 578 閱讀 9673

目錄

偏差與方差

導致偏差和方差的原因

深度學習中的偏差與方差

生成模型與判別模型

兩者之間的聯絡

優缺點常見模型

先驗概率與後驗概率

在監督學習中,模型的泛化誤差可分解為偏差、方差與雜訊之和

偏差用於描述模型的擬合能力

方差用於描述模型的穩定性

方差通常是由於模型的複雜度相對於訓練集過高導致的

監督學習模型可分為生成模型與判別模型

生成模型學習的是聯合概率分布p(x,y),然後根據條件概率公式計算p(y|x)

隱變數:當我們找不到引起某一現象的原因時,就把這個在起作用,但無法確定的因素,叫做「隱變數」

缺點

生成模型

缺點 生成模型

條件概率(似然概率)

先驗概率

​​​​​​​後驗概率

貝葉斯公式

ML基礎 機器學習基礎

收集資料 我們可以使用很多方法收集樣本資料,如 製作網路爬蟲從 上抽取資料 從rss反饋或者api中得到資訊 裝置傳送過來的實測資料 風速 血糖等 提取資料的方法非常多,為了 節省時間與精力,可以使用公開可用的資料來源。準備輸入資料 得到資料之後,還必須確保資料格式符合要求,此外還需要為機器學習演算...

機器學習ML策略

機器學習ml策略 1 為什麼是ml策略 例如 識別cat分類器的識別率是90 怎麼進一步提高識別率呢?想法 1 收集更多資料 2 收集更多的多樣性訓練樣本 3 使用梯度下降訓練更長時間 4 嘗試adam代替梯度下降 5 嘗試更大的網路 6 嘗試更小的網路 7 嘗試dropout 8 嘗試l2正則化 ...

機器學習 ML分類

為了更好的學習機器學習知識,進行機器學習的分類 按照機器學習任務分類可以分為 分類問題是我們最常用的任務,如,新聞分類,分類,檔案分類可以按照各個領域進行分類,如教育,體育,科技,經濟等等 聚類問題,簡單的說是群,俗話是物以類聚,目的是將樣品劃分為緊密關係的子類或者是簇 最常用的是用k means聚...