機器學習的本質

2021-07-03 01:55:24 字數 363 閱讀 6712

一般而言,機器學習方法包含以下幾個元件:

假設集h :所有**用的函式h的集合,根據其輸出值,可以將問題分為回歸和分類

資料d:已知的資料集合,通常包含訓練資料和測試資料

演算法a:在h中選取乙個在d上表現最好的假設,在實際中,就是通過最優化理論來選擇模型引數。

vc bound :在訓練資料和測試資料從同乙個概率分布抽取,且資料量夠大時時,對於常見的 error measure(0/1 error, square error 等),h在訓練資料上的表現與在測試資料上的表現接近,於是我們可以通過最小化訓練資料上 error 來最小化在整個資料分布上的 error。

不管機器學習演算法怎麼變,這些元件都差不多,我認為它們就是機器學習的本質。

從本質如何理解機器學習

手推機器學習各大經典演算法成為演算法研發崗位的必備內容。無論您是從事資料探勘還是應用機器學習進行影象識別和商品推薦。僅僅會呼叫 python 機器學習包是不具備競爭力的。而機器學習演算法繁多,每個都靠記憶推導公式來記住機器學習演算法這是很困難的。只有了解,從演算法發明者的角度出發理解演算法原理,才能...

機器學習中分類與聚類的本質區別

機器學習中有兩類的大問題,乙個是分類,乙個是聚類。在我們的生活中,我們常常沒有過多的去區分這兩個概念,覺得聚類就是分類,分類也差不多就是聚類,下面,我們就具體來研究下分類與聚類之間在資料探勘中本質的區別。分類有如下幾種說法,但表達的意思是相同的。分類演算法的侷限 分類作為一種監督學習方法,要求必須事...

機器學習中分類與聚類的本質區別

機器學習中有兩類的大問題,乙個是分類,乙個是聚類。在我們的生活中,我們常常沒有過多的去區分這兩個概念,覺得聚類就是分類,分類也差不多就是聚類,下面,我們就具體來研究下分類與聚類之間在資料探勘中本質的區別。分類有如下幾種說法,但表達的意思是相同的。分類問題是用於將事物打上乙個標籤,通常結果為離散值。例...