本文試圖用乙個簡單的案例來描述機器學習的各種術語。個人認為機器學習入門未必有多難,但這些術語常令人不明覺厲,也讓人望而卻步。
案例一:某程式能夠根據人員資訊計算該人的信用等級。該程式根據已有的100萬個申請記錄【年齡、性別、年收入 、學歷 、房產、 信用級別】進行複雜的數**算,得出一套運算規則,該規則對【年齡、性別、年收入 、學歷 、房產】這些資料項進行加權計算,形成分數,並根據分數得出信用級別【不合格、銀卡、金卡】。有了這套規則,只需要輸入某使用者的相應資訊,就能知道是否可以辦理信用卡了。
案例二:鳥類學家在各地安裝了一萬個餵食器,並通過感測器採集下表所示資訊(大約1萬條),再用機器學習程式自動確定鳥的種屬。請根據上述知識,腦補一下在本例中什麼是樣本、特徵、類別以及本例屬於哪類機器學習?
序號體重(克)
翼展(厘公尺)
腳蹼後背顏色種屬1
1000.1
125.0無棕色
紅尾鵟2
3000.7
200.0無灰色
鷺鷹33300.0
220.3無灰色
鷺鷹44100.0
136.0有黑色
普通潛鳥
案例一描述並不準確,形成運算規則並不一定要採用加權計算的方式,事實上,針對不目的問題需要採用不同的演算法:
回歸
非監督學習
待補充......
機器學習學習筆記
2.機器學習書籍 機器學習tom,這個是老經典,就是翻譯欠佳 prml,這個書正版的超貴,但是比較新且系統,可以通過其他途徑搞個副本。3.自己動手編碼實現2 3種經典演算法,比如svm,lr,bpnn等。4.了解spark上目前支援的機器學習方法的用途和用法,這個在日常工作中會用到。知道的多一點,方...
機器學習 學習筆記
關於梯度下降演算法的優化與 會有三種方法優化梯度下降演算法 1.共軛梯度下降法 conjugate 2.變尺度法 bfgs 3.限制變尺度法 l bfgs 這些方法的好處是 1.不用選擇學習速率 2.收斂的速度快,執行效率高 但是她們的缺點在於 實現她們的方法太複雜,所以我們就可以使用語言的內建庫函...
機器學習 學習筆記
監督學習 我們的學習演算法使用的資料是給出正確答案的資料,然後我們執行學習演算法,出更多的正確答案。理解為像深度需學習類似,利用訓練樣本訓練處學習模型,然後用測試樣本對學習到的模型進行檢測,輸出 結果。無監督學習 可以理解為對於學習演算法所使用的資料集並沒有給出正確答案,學習演算法就是要對這資料集進...