宣告:本部落格是學習 easy_ray 作者的部落格做的筆記tom mitchell 寫的 《machine learning》 中給出了乙個比較學術的描述:「對於某類任務t和效能度量p,如果乙個電腦程式在t以上以p衡量的效能隨著經驗e而自我完善,那麼我們稱這個電腦程式正在從經驗e學習」
任務t --> **的目的(通過**來實現根據房子大小面積等特徵來**房價的模型)
效能度量t --> 評價所構建模型的精準度(**房價的誤差誤差越小越好)
經驗e --> 資料(某城區100套房子的面積和**的真實資料)
例項 :
擁有100組資料例項,構建模型,利用100組資料去訓練這個模型,將100組資料傳送給模型,模型根據這一段資料不斷修正模型引數來自我完善,最終結果我們可以任意將乙個房子的面積或者其他特徵性資訊輸入到模型裡,改模型就會**出房子的**。
例項**
房子尺寸/平方公尺
房子**/萬
100120
8092
120143
7587
6060
4350
資料的視覺化折線圖
構建模型
將以上資料傳到資料模型中,訓練模型,說白了就是用資料來測試功能,最後哪個差值最小哪個功能演算法就相對比較好。模型最終輸出一條擬合線。
粗略總結
利用這條擬合線來**房價,當輸入房子尺寸對應輸出**。
這裡只是大概介紹了下簡要流程,並沒有涉及技術和演算法的介紹。我也是一邊看別人的部落格一邊學習,隨手做個我自己理解的筆記。
supervised learning 監督學習
實際上,我們手裡有一組資料,房子尺寸和**,放到模型中可以**出**。
監督學習可以分為兩類:
1、回歸(regression)
2、分類(classification)
使用以上概念所舉的例子,散點資料中擬合的那條曲線,輸入的值是單獨的,但是輸出的y是連續的值,所以歸類為回歸問題。
舉例:醫院腫瘤資料,1代表惡性,0代表良性,可以通過腫瘤的大小進行**病人的腫瘤是良性還是惡性。
腫瘤大小/厘公尺
是否為惡性10
1212.50
1.9071
91畫出散點圖:
紅色—惡性
藍色—良性
訓練資料可以簡單判斷出如果腫瘤大小超過6厘公尺,有可能是惡性腫瘤
回歸問題輸出的是乙個連續的值,比如放假,利潤等
分類問題輸出的結論性的值。
無監督學習(unsupervised learning)
左—監督學習,右—無監督學習
監督學習已經知道這些資料的特徵,左下角圓形資料,右上角是紅叉。、
無監督學習並不知道這個資料到底有哪些特徵,只能通過學習來摸索到這些資料有哪些特徵。(聚類問題)
強化學習(reinforcement learning)
強化學習中沒有給定的資料,不像監督學習和無監督學習不管怎麼樣都有給定的資料進行樣本擬合,分類,聚類等操作。
類似於正反饋學習,通過實際中的結論不斷反饋來強化學習的演算法。
大總結
我覺得部落格博主總結的很不錯,我就直接摘下來了。
機器學習筆記(一) 了解機器學習
1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...
機器學習了解
機器學習的核心是 使用演算法解析資料,從中學習,然後對世界上的某件事情做出決定或 這意味著,與其顯式地編寫程式來執行某些任務,不如教計算機如何開發乙個演算法來完成任務。有三種主要型別的機器學習 監督學習 非監督學習和強化學習,所有這些都有其特定的優點和缺點。監督學習涉及一組標記資料。計算機可以使用特...
機器學習之SVM(粗略的筆記)
svm是 supportvectormachine的簡 稱,它的中文名 為支援向量機,屬於一種有 監督的機器 學 習演算法,可用於離散因 變數的分類和 連續因變數的 通常情況下,該演算法相 對於其他單 一的分類 演算法 如 logistic回歸 決策樹 樸素貝 葉斯 knn 等 會有更好的 準確率,...