機器學習概述
機器學習是這樣一門學科,它致力於研究如何通過計算的手段,利用經驗來改善系統自身的效能。在計算機系統中,「經驗」通常以「資料」形式存在,因此機器學習所研究的主要內容,是關於在計算機上從資料中產生「模型」的演算法,即「學習演算法」。有了學習演算法,我們把經驗資料提供給它,他就能基於這些資料產生模型;在面對新的情況時,模型會給我們提供相應的判斷。如果說電腦科學是研究關於「演算法」的學問,那麼類似的,可以說機器學習是研究關於「學習演算法」的學問。基本術語
假設空間
歸納偏好
若認為相似的樣本應有相似的輸出(例如,在各種屬性上都比較像的西瓜,成熟程度應該比較接近),則對應的學習演算法可能偏好圖中比較「平滑」的曲線a而不是比較「崎嶇」的曲線b,反之則相反。對於乙個學習演算法a,若它在某 些問題上比學習演算法b好,則必然存在另一些問題,在那裡b比a好。有趣的是,這個結論對任何演算法均成立。nfl定理有乙個重要前提:所有「問題」出現的機會相同、或所有問題同等重要。但實際情況並不是這樣,很多時候,我們只關注自己正在試**決的問題(例如某個具體應用任務),希望為它找到乙個解決方案,至於這個解決方案在別的問題、甚至在相似的問題上是否為好方案,我們並不關心。發展歷程所以nfl定理最重要的寓意,是然我們清楚地認識到,脫離具體問題,空泛地談論「什麼學習演算法更好」毫無意義,因為若考慮所有潛在地問題,則所有學習演算法都一樣好。
學習演算法自身的歸納偏好於問題是否相配,往往會起到決定性的作用。
應用現狀
談到對資料進行分析利用,很多人會想到「資料探勘」,資料探勘領域在二十世紀九十年代形成,它受到很多科學領域的影響,其中資料庫、機器學習、統計學習無疑影響最大。資料探勘是從海量資料中挖掘知識,這就必然涉及對「海量資料」的管理和分析。大體來說,資料庫領域的研究為資料探勘提供資料管理技術,而機器學習和統計學的研究為資料探勘提供資料分析技術。
第一章 緒論
1.16 void print descending int x,int y,int z 按從大到小順序輸出三個數 print descending 1.17 status fib int k,int m,int f 求k階斐波那契序列的第m項的值f gender char schoolname 校...
第一章 緒論
本 題目源於粵電集團科研專案 沙角a電廠優化排程輔助決策系統 沙角a電廠電網排程已由原來對互不聯絡的單機排程方式發展為對全廠整體總負荷的經濟排程方式,現有五颱發電機組 其中210mw機組三颱,300mw機組二台 的主要工作如下 1.實時資料採集及預處理 機組效能計算和能損分析建立在準確獲取現場資料的...
第一章 緒論
1.1 資料結構在程式設計中的作用 a 問題 資料模型 基本思路 想法 資料表示 資料處理 演算法 程式語言 程式設計環境 設計方法 程式 b 著名公式 資料結構 演算法 程式 1.2 本書討論的主要內容 a 問題一般分為 數值問題 非數值問題 a 數值問題抽象出的資料模型通常是數學方程 b 非數值...