我是個剛入門機器學習的菜鳥,導師最開始推薦的書就是周志華著的機器學習,我們都叫西瓜書,雖然很多人都說這本書很好,但是對我來說很多內容介紹的不適合自己理解,然後師兄推薦了一本統計學習方法,我覺得這本書真的把每個模型和演算法都介紹來的利於理解,也可能是自己比較適合,親身感覺不像機器學習寫的那麼寬泛不好理解,也或許每個人的理解是不一樣的,我就記錄下自己對於一些模型的理解。
首先了解下一些概念
輸入輸出空間,特徵空間:所有特徵向量存在的空間,回歸問題:輸入與輸出變數均為連續變數的**問題,分類問題:輸出變數為有限個離散變數的**問題,標註問題:輸入與輸出變數均為變數序列的**問題。正則化和泛化能力在我上一章部落格有介紹,然後就是交叉驗證以及分類情況。裡面對於感知機模型、樸素貝葉斯模型、支援向量機等都給出了具體演算法步驟和例項。個人覺得非常適合初學者,只是需要一些概率論、數學基礎,有的證明也比較清楚,對於我來說是相對來說很好理解的一本書。通過簡單的介紹引入模型構建,然後給出演算法計算,最後給出例項理解。機器學習中的內容比較抽象和寬泛,我覺得我理解起來就是感覺資訊很多,有很多的東西我不知道原理也找不到,不是很便於對於演算法的掌握和學習。統計學習中通過每乙個例項,讓你不僅僅在公式中理解,能夠從例項中更好地學習演算法。
機器學習 統計學習
機器學習 一種讓計算機利用資料而非指令來進行各種工作的方法。計算機使用輸入給他的資料,利用人類賦予的演算法,得到某種模型的過程,其結果是使用該模型,未知資料資訊。在統計理論下的本質 它追求的是合理的假設空間 模型在數學上的適合場合 的選取和模型的泛化能力 模型在未知資料上的表現能力 統計學習 sta...
統計學習基本三要素 基礎知識
方法 模型 策略 演算法 模型 1.決策函式的集合 2.引數空間 3.條件概率的集合 4.引數空間 策略 損失函式 風險函式 o 1損失函式 平方損失函式 絕對損失函式 對數損失函式 損失函式的期望 經驗風險 演算法 如果最優化問題有顯式的解析式,演算法比較簡單。但通常解析式不存在,就需要數值計算的...
機器學習基礎知識
machine learning的主要兩個應用方面 人工智慧 資料科學。什麼是人工智慧 artificial intelligence ai是不確定性管理 uncertainty management 的體現 ai what to do when you don t know what to do ...