網易公開課學習筆記
機器學習的定義
arthur samuel:「在不直接針對問題進行程式設計的情況下,賦予計算機學習能力的乙個研究領域」
讓計算機學會如何下棋,並超過自己
tom mitchell:給計算機乙個任務t和效能測試方法p,如果在經驗e的影響下,p對t的測量結果得到了改進,我們說程式從e中得到了學習
e(experience):程式不斷和自己下棋的經歷
t(task):下棋
p(performance):程式和人下棋勝出的概率
一、supervised learning(監督性學習)
學習標準輸入和標準答案間的關係,給我們提供乙個某種意義上的正確答案
回歸問題 regression problem,需要測量的變數是連續的:房屋面積和房屋**的關係
分類問題 classification problem,需要測量的變數是離散的:乳腺癌腫瘤資料,腫瘤大小和腫瘤是否為良性的關係(是否為良性,取值只有0或1),
通過腫瘤大小,病人年齡,腫瘤是否良性的資料來**新輸入的病人資料結果是否為良性
支援向量演算法,將資料對映到無線緯的空間中,處理無限種特徵
二、learning theory(學習理論)
三、unsupervised learning(無監督性學習)
聚類問題,使用者畫像、分類
計算機群組織、社交網路分析、市場劃分
四、reinforcement learning(加強學習)
進行一次性決策,如何定義乙個好的行為
應用:機械人領域、網頁爬取
機器學習 機器學習目錄
注 後期有時間的話會對每乙個演算法進行講解。1 普通線性回歸 2 廣義線性模型 3 邏輯回歸 4 線性判定分析1 決策樹基本原理與構建 2 cart演算法 3 回歸決策樹 4 分類決策樹1 貝葉斯定理與樸素貝葉斯 2 高斯貝葉斯分類器 3 多項式貝葉斯分類器 4 伯努利貝葉斯分類器 5 遞增式學習1...
機器學習 機器學習概論
3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...
機器學習 機器學習基礎
資料集劃分的api 返回值 訓練特徵,測試特徵,訓練目標,測試目標 方式1 獲取小規模的資料集 importsklearn.datasets as datasets iris datasets.load iris 提取樣本資料 feature iris data target iris target...