無監督演算法:
kmeans演算法:
1、 隨機初始化資料集簇的中心,一般從資料集中選擇
2、 外迴圈:
內迴圈:計算各個數值點到中心的距離,進行聚類
計算每個聚類的平局值,移動聚類中心
pca演算法:
目標:資料壓縮和視覺化
1、 對樣本資料進行去均值和歸一化
2、 組建sigma矩陣,然後進行奇異值分解,求的壓縮和的結果z
異常檢測演算法:
1、 選擇可能適應於異常樣本的特徵
2、 根據樣本得到高斯分布的均值和方差
3、 對給定的樣本計算其是否為異常樣本
異常檢測與監督學習:
異常檢測:正樣本數量較少(0-20);大量的負樣本
不同型別的正樣本,很難從正樣本中學的演算法將其識別出來
未來會出現之前從未出現過的正樣本,與當前的正樣本無相似性
監督學習:有大量的正樣本和負樣本;
足夠的樣本支撐可以從中學到正樣本的特徵的檢測演算法
未來很難出現正樣本中未出現過的樣本
常見的異常檢測和監督學習:
異常檢測:欺詐行為/製造業/資料中心的監測
監督學習:垃圾郵件/天氣/癌症
有監督演算法和無監督演算法的理解
無監督和有監督的理解方法有很多,主要可以從以下幾方面來理解 1 無監督與監督學習的區別在於乙個無教學值,乙個有教學值。但是,個人認為他們的區別在於無監督學習一般是採用聚簇等演算法來分類不同樣本。而監督學習一般是利用教學值與實際輸出值產生的誤差,進行誤差反向傳播修改權值來完成網路修正的。但是無監督學習...
2017 07 13 無監督演算法評估
無監督學習的評估方法 1.normalizedmutual information 度量2個聚類結果的相近程度 2.以sqrt n 或者更小的隨機subsampling出的樣本去聚類 m次,看看有哪些點分類不太一致 改變聚類引數,達到比較結果 3.把無監督學習的結果帶給乙個有監督的任務來衡量 引入有...
無監督聚類演算法
劃分聚類 k means 聚類 k means演算法,也被稱為k 平均或k 均值,是一種廣泛使用的聚類演算法,或者成為其他聚類演算法的基礎。k means 對初值敏感,可以使用 k mediods聚類 k 中值聚類 選擇較好的聚類初值 k means 演算法,不同與k means演算法隨機選擇聚類中...