從n個資料物件中任意選擇k個物件作為中心進行聚類。
k-means演算法接受引數k,將事先輸入的n個物件劃分為k個聚類使得所獲得的聚類滿足:同乙個聚類中的物件相似度較高;不同聚類中的物件相似度較小。(相似度大=距離小;相似度小=距離大)
首先從n個資料物件任意選擇k個物件作為初始聚類中心,對於剩下的其他物件,則根據它們與這些聚類中心的相似度(距離)分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然後再計算每個所獲新聚類的聚類中心(該聚類中所有物件的均值);不斷重複這一過程直到標準測度函式開始收斂為止。
各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。
1.演算法快速、簡單。
2.對大資料集有較高的效率並且是可伸縮性的。
3.時間複雜度為o(nkt),近於線性,適合挖掘大規模資料集。
1.k是事先給定的,這個k值的選定是非常難以估計的。
2.在k-means演算法中,首先需要根據初始聚類中心來確定乙個初始劃分,然後對初始聚類中心進行優化。這個初始聚類中心的選擇對聚類結果有較大影響,一旦初始值選擇的不好,可能無法得到有效的聚類結果。
3.該演算法需要不斷進行樣本分類調整,不斷地計算調整後的新的聚類中心,因此當資料量非常大時,演算法的時間開銷是非常大的。
輸入學習樣本,使用反向傳播演算法對網路的權值和偏差進行反覆的調整訓練,使輸出的向量與期望向量盡可能地接近,當網路輸出層的誤差平方和小於指定的誤差時間時訓練完成,儲存網路的權值和偏差。
主要分為以下兩個階段:
1.正向傳播:
輸入樣本–>輸入層–>隱含層–>輸出層
判斷是否轉入反向傳播階段,若輸出層的實際輸出與期望值的輸出不符,進入誤差反傳階段。
2.誤差反傳:
誤差以某種形式在各層表示–>根據誤差對權值的偏導數來修正各層單元的權值。
當誤差對權值的偏導數大於0時,權值調整量為負,實際輸出大於期望輸出,權值向減少方向調整,使得實際輸出與期望輸出的差減小。
當誤差對權值的偏導數小於0時,權值調整量為正,實際輸出少於期望輸出,權值向增大方向調整,使得實際輸出與期望輸出的差減小。
附圖幫助理解:
BP神經網路
基本bp神經網路演算法包括 訊號的前向傳播 誤差的反向傳播 也即計算實際輸出時按照輸入到輸出的方向進行,權值閾值調整則相反。bp是一種多層前饋神經網路,由輸入層 隱含層和輸出層組成。層與層之間有兩種訊號在流動 一種是從輸入流向輸出的工作訊號,是輸入和權值的函式 另一種是輸入流向輸出的訊號,即誤差。隱...
BP神經網路
x 為輸入向量,y為隱藏層的神經元,z 為輸出層,d為目標真實值,本文預設 z 不經過sigmod處理。x y的權重為 w,y z的權重為 v yj ix iwij 1 oyi f y j 2 其中激勵函式f x 1 1 e x f x f x 1 f x 3 z k j f yj vjk 此時系統...
BP神經網路
bp是back propagation bp神經網路主要的演算法在於誤差反向傳播error backpropagation 有三層 輸入層 input 隱含層 hidden 輸出層 output 輸入層 n個神經元 隱含層 p個神經元 輸出層 q個神經元 輸入向量 x x1,x2,x n 隱含層輸入...