Python機器學習初識

2021-10-03 22:58:36 字數 929 閱讀 4570

機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的演算法。

機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行**的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與統計推斷學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程式可循難度,所以部分的機器學習研究是開發容易處理的近似演算法。

機器學習已經有了十分廣泛的應用,例如:資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡欺詐、**市場分析、dna序列測序、語音和手寫識別、戰略遊戲和機械人運用。

歸納與演繹:

1.歸納:從特殊到一般的「泛化」:從樣例(訓練樣本)中學習。

如:根據已知資料集總結滿足何種條件的西瓜是好瓜?

色澤烏黑、根蒂蜷縮、敲聲濁響的就是好瓜?

色澤烏黑、根蒂稍蜷、敲聲沉悶的就不是好瓜?

通過對資料集中的訓練集進行機器學習建立模型來推測好瓜的特點和規律;

版本空間:與訓練集一致的假設的集合稱為「版本空間」。

顧名思義就是包含訓練集屬性對應值的乙個或幾個的集合;

2.演繹:從一般到特殊的「特化」:從數學公理推導出定理。

對新樣本,不同假設可能輸出不同結果。問題:該相信哪條假設?

已有訓練集6個樣例(x,y),要學得與其一致的模型,相當於找到一條穿過所有點的曲線。然而這樣的線有無數多條。

學習演算法必有偏好,選擇不同的演算法會產生不一樣的結果;那麼如何選擇乙個好的模型或者演算法?

可以採用簡單優先的原則,也叫奧卡姆剃刀原則。

end

機器學習 初識機器學習

1.什麼是機器學習?對於機器學習到現在都還沒有統一的定義,但是,通過乙個例子和較權威的定義來理解機器學習,最後附上我個人對機器學習的理解 2.監督學習 1 監督學習基本思想 我們資料集中的每個樣本都有相應的 正確答案 即每個樣本都是真實值,再根據這些樣本作出 舉乙個房價預售的例子來說明 eg 下面圖...

初識機器學習

學機器學習已經大半年了,現在才發現自己是初識機器學習。一開始學機器學習,真的以為它是個機器,學會了就可以拿來用,或是拿來改進。現在才明白,學機器學習的方法不僅要弄明白理論基礎和演算法思路,還要明白演算法的脈絡,它的每一步都是為什麼這麼做,掌握演算法背後的真正的思想,才能融會貫通,針對不同的問題提出不...

初識機器學習

機器學習 資料 資料 做為輸入 輸出 找到最合適的演算法公式 機器學習的分類 有批量 batch 數量的情況下可應用 監督式學習 知道輸入與輸出 半監督式學習是 知道輸入與部分輸出 無監督式學習 不知道輸出 對應著聚類 clustering 對於機器學習的輸出 1.有明確的分類 是 否 並且是用一條...