機器學習筆記(2019 4)

2021-09-22 13:01:21 字數 1148 閱讀 3032

分類模型: 是指輸出連續化的;目的是尋找決策邊界;

回歸模型: 是指輸出離散化的;比如天氣**問題,根據之前的天氣,**出之後幾天的天氣;目的是尋找最優擬合;

決策樹方法就是一種根據各種特徵(其中這些特徵的權重是不同的)來做出決策的一種方法;

比如你要買電腦,特徵有cpu, gpu, 記憶體等等特徵, 那麼這些不同的特徵對你買不買的影響是很大的,很多人首先看重的是cpu的好壞,然後之後是gpu或者記憶體;這樣下來的決策,就形成了類似數的結構(也是使用非線性方法解決問題的乙個模型)

含義:把求損失函式最小值的過程中,需要乙個遞迴求最優解的過程,在這個過程中,一般採用梯度下降,即求出函式的最佳斜率,使y值使用最少的步驟下降到最低點。

數學含義: 求解乙個可導函式,使得損失函式在最低點得到解的過程。

中間函式:(其中q1為移動的距離點1)

如果乙個學習速率太大,那麼很可能會錯過最佳值; 如果過小,就會導致下降太慢,耗費大量時間;

1.1 複習積分

d(x^2)/dx ===⇒ 2x

規則: 導數:即為求乙個函式在某處的斜率;

在求導的過程中, x的次冪寫在最前面,然後x的次冪減一後寫下來;

學習速率體驗例子: 谷歌機器學習簡介

我從別的文章找到一張圖:

識別的原理是這樣的,把乙個數字的視為有n*n個畫素點組成的,這些畫素點如果是黑色的,則為1-255的範圍,如果不是就為0,這樣在計算交叉熵的時候, 0的畫素點就不會影響結果,即為0;

公式:y:輸出, label:標籤

-sum(label * log(y))

[0,0,0,0.6] * [0.1,0.2,0,1] = -log(0.6)

就是在最開始就定義了正樣本或者負樣本的學習方法,前提是已經有了大量的資料可以供程式學習,讓程式判斷是正是負,最後得出正 | 負的結果;比如**房價;

不知道什麼是正樣本或者負樣本的學習方法;比如新聞**在網上爬取新聞,將其歸類;

機器學習學習筆記

2.機器學習書籍 機器學習tom,這個是老經典,就是翻譯欠佳 prml,這個書正版的超貴,但是比較新且系統,可以通過其他途徑搞個副本。3.自己動手編碼實現2 3種經典演算法,比如svm,lr,bpnn等。4.了解spark上目前支援的機器學習方法的用途和用法,這個在日常工作中會用到。知道的多一點,方...

機器學習 學習筆記

關於梯度下降演算法的優化與 會有三種方法優化梯度下降演算法 1.共軛梯度下降法 conjugate 2.變尺度法 bfgs 3.限制變尺度法 l bfgs 這些方法的好處是 1.不用選擇學習速率 2.收斂的速度快,執行效率高 但是她們的缺點在於 實現她們的方法太複雜,所以我們就可以使用語言的內建庫函...

機器學習 學習筆記

監督學習 我們的學習演算法使用的資料是給出正確答案的資料,然後我們執行學習演算法,出更多的正確答案。理解為像深度需學習類似,利用訓練樣本訓練處學習模型,然後用測試樣本對學習到的模型進行檢測,輸出 結果。無監督學習 可以理解為對於學習演算法所使用的資料集並沒有給出正確答案,學習演算法就是要對這資料集進...