目錄
現實問題思考
無監督學習(unsupervised learning)
特點、優點與應用
聚類分析(cluster analysis)
知識鞏固
拓展學習
分組一:站著或非站著
分組二:白色或黃色
分組三:吐舌頭或不吐舌頭
定義:機器學習的一種方法,訓練資料中不帶標籤,讓機器自動尋找資料規律並完成任務。
歸納一下無監督學習和有監督學習兩者的區別:
1. 對訓練集與測試樣本的使用方式不同。監督學習目的在訓練集中找規律,然後對測試樣本運用這種規律。而無監督學習沒有訓練集,只有一組資料,在該組資料集內尋找規律。
2. 訓練樣本是否有標籤。有監督學習的識別的結果表現在:給待識別資料加上了標籤,因此訓練樣本集必須由帶標籤的樣本組成。而無監督學習方法只有要分析的資料集的本身,預先沒有什麼標籤。如果發現資料集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標籤對上號為目的。
3. 無監督學習方法在尋找資料集中的規律性,這種規律性並不一定要達到劃分資料集的目的,也就是說不一定要「分類」。比如,一組顏色各異的積木,它可以按形狀為維度來分類,也可以按顏色為維度來分類。(這一點比監督學習方法的用途要廣。如分析一堆資料的主分量,或分析資料集有什麼特點都可以歸於無監督學習方法的範疇) ,而有監督學習則是通過已經有的有標籤的資料集去訓練得到乙個最優模型。
如上圖,無監督學習不需要考慮顏色或形狀就可以立即識別出兩個類。事實上,圓點(以及三角形)確定了乙個集合,不管集合內的點之間的分離程度如何,圓點所代表的集合很容易與三角形代表的集合分離開來。這就像是當理想的樣本是海洋時,僅僅考慮島嶼之間的相互位置和內部聯絡就可以將海洋分成幾個區域。
今天 ,無監督學習是人工智慧領域非常重要的方法,facebook人工智慧團隊首席科學家yann lecun認為,無監督學習是ai技術的未來,用模擬器將會提高無監督學習的效率。而谷歌首席科學家,谷歌大腦技術負責人vincent vanhoucke則說,半監督學習革命已經來了。
特點:
優點:
主要運用:聚類分析、關聯規則、維度縮減
把資料樣本按照一定的方法分成不同的組別,這樣讓在同乙個組別中的成員物件都有相似的一些屬性
問題:無監督學習的一大特點是資料樣本不要提前標註輸出結果,思考這個特點帶來的影響。
如果現在就想開始學習機器學習,你還可以:
機器學習與python實戰(一) k近鄰
knn k nearest neighbor 演算法是乙個簡單而經典的機器學習分類演算法,通過度量 待分類資料 和 類別已知的樣本 的距離對樣本進行分類。from numpy import import operator 產生資料集 defcreatedataset groups array 1.0...
Python機器學習入門
numpy python科學計算基礎包 import numpy as np 匯入numpy庫並起別名為np numpy array np.array 1,3,5 2,4,6 print numpy array scipy python中用於科學計算的函式集合 from scipy import s...
團隊拙作《Python機器學習實戰》
之前看國內外的 python 機器學習的書,鮮有將機器學習到底怎麼做人臉識別 怎麼做風險控制 怎麼做 ocr 演算法模型列出的,並且真正的乙個 python 應用,不止是從機器學習庫中匯入一下配置一下引數那麼簡單。我們所有的例子程式,獨此一家,別無分號。本書的主要內容分為四大部分 1 python開...