4. 基本步驟
5. 基本術語
6. 參考
機器學習(machine learning)是一門人工智慧的學科,它模擬人類的學習行為,從已有的資料中習得經驗,再利用這些經驗對未知的資料進行**或判斷,以此來改善計算機演算法的效能。
與傳統程式設計和演算法相比:
傳統程式設計由程式設計師給演算法指定規則,機器學習由程式自主學習規則。
傳統程式設計主要依賴於對問題的邏輯分析,機器學習需要依賴大量的資料。
傳統演算法的效能取決於程式的設計,機器學習模型的效能取決於演算法習得的模型引數。
機器學習的優點有:
機器學習演算法可以為傳統演算法無法解決的問題提供解決方案。
機器學習演算法能夠從大量資料中找到資料的潛在規律和價值。
機器學習的缺點有:
機器學習演算法在一些細節上不夠直觀、可解釋性相對傳統演算法較差。
機器學習演算法具有很強的針對性,通常乙個機器學習演算法只適用於解決乙個特定的問題。
按照資料集是否有標記,可以將機器學習演算法分為2類:
監督學習(supervised learning)演算法。
無監督學習(unsupervised learning,也稱非監督學習)演算法。
監督學習演算法使用的資料集包含樣本的特徵和標記。2類典型的監督學習演算法:
回歸(regression)演算法:回歸演算法使用的資料集的樣本標記和**輸出是連續值。可應用於****、流量**、溫度**等問題。
分類(classification)演算法:分類演算法使用的資料集的樣本標記和**輸出是離散值。可應用於決策、分類、文字分類等問題。
無監督學習使用的資料集只包含樣本的特徵,不包含標記。2類典型的無監督學習演算法:
聚類(clustering)演算法:聚類演算法的目標是根據樣本的相似度將樣本分成多個不同的簇(cluster)。可應用於分組、影象分割等問題。
降維(dimension reduction)演算法:降維演算法的目標是在保證資料所具有的代表性特徵或分布的情況下,將高維資料轉化為低維資料。可應用於影象壓縮、資料視覺化等問題。
載入資料集。
選擇模型,初始化模型引數。
選擇損失函式、優化方法和必要的超引數。
在訓練集上訓練模型,更新模型引數。
在測試集上對模型的效能進行測試。
資料集(data set):一組樣本的集合,每個樣本是關於乙個事件或物件的描述。
特徵(feature):乙個事件或物件的屬性。
標記(label):乙個事件或物件的結果或答案。
訓練集(training set):資料集的子集,用於訓練模型。
測試集(test set):資料集的子集,用於測試模型的表現。
樣本(sample):資料集的一行內容。乙個樣本包含了特徵,可以包含標記。
模型(model):機器學習演算法從訓練集中所學內容的表示。
模型引數(model parameter):機器學習演算法自行訓練的模型的變數,如權重(weight)、偏置項(bias)。
損失函式(loss function):一種衡量指標,用於衡量模型的**與標記之間的偏差。
優化方法(optimization method):不同型別的梯度下降演算法。
學習率(learning rate):確定以多大的程度更新模型引數。
超引數(hyperparameter):訓練過程中可人為調節的引數,如學習率。
……機器學習和傳統程式設計有什麼區別?
機器學習術語一覽表
機器學習/周志華著. --北京: 清華大學出版社,2016(2016.2重印)
本文內容純屬個人學習過程中的筆記和思考,不作為詳細的教程。見解尚淺,承蒙斧正。
like a swift, like a python.——落空開關,a fallthrough switch
機器學習 初識機器學習
1.什麼是機器學習?對於機器學習到現在都還沒有統一的定義,但是,通過乙個例子和較權威的定義來理解機器學習,最後附上我個人對機器學習的理解 2.監督學習 1 監督學習基本思想 我們資料集中的每個樣本都有相應的 正確答案 即每個樣本都是真實值,再根據這些樣本作出 舉乙個房價預售的例子來說明 eg 下面圖...
吳恩達機器學習筆記(01) 初識機器學習
arthur samuel認為在沒有明確設定的情況下,使得計算機具有學習能力的研究領域。例如 跳棋程式通過與使用者對弈,觀察哪些布局容易贏,哪些布局容易輸,就能學會跳棋,知道什麼布局是好的,什麼布局是壞的。tom mitchell認為,電腦程式從experience 經驗 e中學習來解決某一task...
初識機器學習
學機器學習已經大半年了,現在才發現自己是初識機器學習。一開始學機器學習,真的以為它是個機器,學會了就可以拿來用,或是拿來改進。現在才明白,學機器學習的方法不僅要弄明白理論基礎和演算法思路,還要明白演算法的脈絡,它的每一步都是為什麼這麼做,掌握演算法背後的真正的思想,才能融會貫通,針對不同的問題提出不...