機器學習有兩種定義,一種是 arthur samuel 所描述的:機器學習是機器學習是一種能夠賦予機器學習的能力以此讓它完成直接程式設計無法完成的功能的方法。這是乙個過時、非正式的定義。tom mitchell 給出一種更現在的定義:
乙個程式被認為能從經驗e中學習,解決任務 t,達到
效能度量值p,當且僅當,有了經驗e後,經過p評判,
程式在處理 t 時的效能有所提公升。
例子:下棋
e=下很多盤棋的經驗。
t=下棋的任務。
p=程式能在下一局中獲勝的概率。
機器學習問題通常分為類:監督學習和無監督學習。
在監督學習中,我們給出乙個資料集並且知道正確輸出的樣子,對輸入和輸出之間的關係明了。
監督學習問題歸類成「回歸」和「分類」問題。在**問題中,我們嘗試在連續的輸出中**結果,意味著我們正在試著將輸入的因素對映成一些連續的函式。而在乙個分類問題中,我們嘗試將**歸結成乙個非連續的結果。換句話說,我們試圖將輸入因素對映為離散的類別。
例子1:
給出房子真實的建築面積,嘗試去**它的**。**作為面積的函式是乙個連線的輸出,所以這是乙個回歸問題。
如果把輸出替換成這個房子的售價是否高於或低於要價,那麼這個例子就轉換成乙個分類問題。
例子2:
(a)回歸—給出乙個人的**,通過****這個的年齡。
(b)分類—給出乙個腫瘤患者,**腫瘤是良性還是惡性。
無監督學習允許在很少或者根本不知道結果會是什麼樣子的情況下解決問題。我們不需要知道變數的影響就可以從資料中挖掘結構。
我們可以根據資料中變數之間的關係對資料進行聚類,從而得出這種結構。無監督學習沒有基於**結果的反饋。
例子:聚類:對於1000000個不同的基因集合,找到一種方法,自動將這些基因分成不同的變數組,如壽命、位置、角色等。
非聚類:雞尾酒會演算法,要求我們在乙個混亂的環境中找到結構。(即在雞尾酒會上從一片聲音中辨別出個人的聲音和**)。
機器學習系列筆記一 Introduction
機器學習的工作流程 機器學習演算法的傳統分類 機器學習演算法的其他分類方式 引數學習 非引數學習 以鳶尾花的資料集為例 花萼長度 花萼寬度 花瓣長度 花瓣寬度 種類5.1 3.21.4 0.2se 0 7.03.2 4.71.4 ve 1 6.33.3 62.5 vi 2 可轉換為多分類問題的任務 ...
關於軟體質量的思考 Introduction
做軟體測試的工作有幾年了,有時會反思一下工作給自己帶來的改變,除了生活上的,發現 也有一些其他的改變。其中的一點是對質量 quality 更加敏感了,生活中遇到的一些不夠quality的東西時很容易聯想到軟體質量上面。這大概是 某種職業病的先兆 經常和同事開玩笑說,說qa做久了,人品變差了,bug會...
PRML筆記 第一章 Introduction
模式識別關注在資料中自動發現資訊並採取行動,例如資料分類。例子 手寫識別。使用規則等方法將導致複雜的規則和例外情況。使用機器學習方法,利用訓練集自動調整引數。目標模式是已知的數字0 9,成為目標向量t。模式識別的推廣能力是乙個中心目標!預處理 又稱為特徵提取。輸入資料大多數需要預處理,是模式識別更加...