**
1.1從兩個問題談起
1.相關概念:
(1)機器學習:是人工智慧的另一部分,也是核心技術。其利用經驗、建立統計模型、概率模型,去解決問題。是對某個實際問題建立計算模型,並利用已知的經驗來提公升模型效果的一類方法。
(2)模式識別:用計算的方法根據樣本的特徵將樣本劃分到一定的類別中去。
2.相關流程:
(1)乙個標準的模式識別流程:
「客觀物件」——>「數值表示」——>「計算機演算法」——>「識別結果」
3.相關區別:
(1)**和資料探勘的區別:
①**是偏重得到決策結果,而資料探勘是偏重分析決策原因和過程。
②**問題主要是在生物特徵鑑別、機器視覺、目標跟蹤等領域,代替人進行決策。資料探勘問題主要是在商業資料、醫學資料裡,給人提供參考。
4.兩個問題:
(1)選擇何種模型?
(2)如何最優化該模型?
1.2模型評估與模型引數選擇
1.訓練得到乙個模型的最終目的:在未知的資料上得到盡可能準確的結果。
2.衡量乙個模型泛化能力的重要標準:泛化誤差。
3.區分誤差:
①訓練誤差:訓練集上的平均誤差
②泛化誤差:測試集上的誤差
4.不能把訓練誤差作為模型引數選擇的標準的原因:
①訓練集樣本太少,缺乏代表性。
②訓練集中本身存在錯誤的樣本
機器學習複習
1.判斷與名稱解釋題 a1.1 資料探勘 在較大資料集上通過某些方式發現模型的乙個過程 1.2 機器學習 研究如何通過計算手段,利用經驗提公升系統的效能 1.3 假設空間 對於資料集a,其data對應的特徵為乙個向量,此向量所在的空間稱為假設空間 1.4 奧卡姆剃刀 若有多個假設與觀測一致,則選擇最...
總複習小結
總複習小結 1 經過一學期的程式設計學習,初步認識基礎資料型別,語句結構,可以做一些簡單的程式設計。此次複習總結了一部分的函式 程式設計技巧及易錯知識點。2 符號常量,定義後不再被賦值,習慣上用大寫字母。例 define pi 3.14 const double pi 3.1415 定義最大值 de...
機器學習複習 Apriori
apriori apriori 是關聯分析中比較早的一種方法,主要用來挖掘那些頻繁項集合。其思想是 1.如果乙個專案集合不是頻繁集合,那麼任何包含它的專案集合也一定不是頻繁集合 2.如果乙個專案集合是頻繁集合,那麼它的任何非空子集也是頻繁集合 aprioir 需要掃瞄專案表多遍,從乙個專案開始掃瞄,...