機器學習 1

2021-07-28 20:51:56 字數 566 閱讀 4681

基本問題的經典演算法

分類:svm、最大熵、adaboost、分類回歸樹、隨機森林

回歸:分類回歸樹、隨機森林、gbdt

排序:gbrank

聚類:k-means

結構標註:隱馬爾可夫模型、條件隨機場。

機器學習=表示(演算法、特徵的表示)+評價(loss+cost評價演算法好壞的函式)+優化(尋找使評價函式得分最高的搜尋方法比如梯度下降、牛頓法)

如何權衡訓練誤差和**誤差(擬合能力和泛化能力,bias-variance,損失函式和推廣能力、經驗風險和結構風險)

a. 正則化。正則化是結構風險最小化策略的實現,與模型複雜度相關,減少引數的候選空間,讓模型更加簡潔。

b. 交叉驗證。交叉驗證的思想是將訓練集隨即劃分成若干個塊,每個塊稱為訓練集和驗證集,訓練集用於訓練模型,驗證集用於評估訓練模型的好壞,在每個塊上找到風險最小化函式,然後綜合把結果綜合起來考慮。

為何梯度下降時需要輸入特徵歸一化?

優化過程中,不同尺度下的引數會使梯度步長更新不一致,造成收斂速度慢;不同尺度的引數也會給計算精度產生影響;模型的正則化效果會由於尺度問題造成偏差。

機器學習 1

學習吳恩達機器學習1 3章 主要內容 對機器學習在生活中的應用做了介紹 郵件分類,新聞分類,疾病 房價 機器學習演算法分類及簡要介紹 監督學習 supervised learning 中的單變數線性回歸 linear regression with one variable 損失函式 cost fu...

機器學習(1)

定義 回歸是指把實函式在樣本點附近加以近似的有監督的函式近似問題。這裡,我們來考慮一下以d次方的實數向量x作為輸入,實數值y作為輸出的函式 y f x 的學習問題,在監督學習裡,這裡的函式關係f是未知的,作為輸入數出 樣本 上標為n,下標為1 是已知的。定義 分類是指對已指定的模式進行有監督的模型識...

1機器學習

1.python環境和pip list 3.什麼是機器學習,有哪些分類?結合案例,寫出你的理解。機器學習是一門多學科交叉專業,涵蓋概率論知識,統計學知識,近似理論知識和複雜演算法知識,使用計算機作為工具並致力於真實實時的模擬人類學習方式,並將現有內容進行知識結構劃分來有效提高學習效率.機器學習有下面...