機器學習入門

2021-08-05 19:53:07 字數 1246 閱讀 2327

1.常用演算法

決策樹

隨機森林演算法

邏輯回歸

svm

樸素貝葉斯

knn演算法

k-means演算法

adaboost 演算法

神經網路

馬爾可夫

2.聚類和分類的區別

分類:比如有一堆資料,你已經事先對他們做好了分類。你想要的功能就是,假如來了一條測試資料,我想知道他是哪一類,這就是分類。

聚類:比如有一堆資料,這些資料並沒有分成特定的類,現在你想對這堆資料進行分類,並且找出他們聚集的原因,這就是聚類。

3.梯度

若有乙個二元函式z=f(x, y),當它由點a移動到點b時(設移動的距離為l),此時函式值z有乙個增量m。當l趨於無限小時,若m/l有乙個極限值,那麼這個極限值就叫做函式在方向ab上的方向導數。

經過點a函式可以朝任意方向移動(當然移動的範圍必須在定義域內),函式就有任意多個方向導數,但其中有乙個方向上方向導數肯定最大,這個方向就用梯度(grad=ai+bj)這個向量來表示,其中a是函式在x方向上的偏導數,b是函式在y方向上的偏導數,梯度的模就是這個最大方向導數的值。

4.利用梯度下降法求最小值

5.偏導數的求法

6.方向導數求法

7.大資料競賽

8.互資訊

反映了兩個事件發生的關聯性

9.資訊熵

資訊熵是消除不確定性所需資訊量的度量,也即未知事件可能含有的資訊量。

乙個事件或乙個系統,準確的說是乙個隨機變數,它有著一定的不確定性。例如,「除東道主俄羅斯外,哪31個國家能進軍2023年俄羅斯世界盃決賽圈」,這個隨機變數的不確定性很高,要消除這個不確定性,就需要引入很多的資訊,這些很多資訊的度量就用「資訊熵」表達。需要引入消除不確定性的資訊量越多,則資訊熵越高,反之則越低。例如「中國男足進軍2023年俄羅斯世界盃決賽圈」,這個因為確定性很高,幾乎不需要引入資訊,因此資訊熵很低

機器學習入門

研究生考試結束了,考研通知書也在幾天前到手了,是時候安心下來考慮一下未來研究生的生活和學習了,看現在機器學習特別的火,所以我就先跟風學習一下機器學習吧。由於剛開始學習,所以對一些專有名詞不是很熟悉,所以特別做了一下總結,因為剛剛入門,所以就先整理了這些。人工智慧 一 認知和感知 區別看待 目前是在感...

機器學習入門

機器學習現在有著非常多的應用,從人臉識別到自動駕駛使用的都是機器學習的技術,機器學習在當前是乙個十分熱門的話題,也是引領下乙個技術變革的方向之一。大量的人員開始關注起機器學習,從初學者再到有經驗的技術人員,投身到機器學習中。但機器學習並不像普通的程式設計一樣,機器學習的入門有一定的門檻,因為機器學習...

機器學習入門

決策樹 decision tree 是在已知各種情況發生概率的基礎上,通過構成決策樹來求取淨現值的期望值大於等於零的概率,評價專案風險,判斷其可行性的決策分析方法,是直觀運用概率分析的一種 法。我把決策樹理解為通過一次一次對各種情況的條件判斷,從而獲得正確的決斷。下圖為一張銀行貸款資料 包含了乙個人...