假設:
終端=4000;業務軟體程序=100;url=16000;
第i個終端包含xi個不同業務軟體程序,包含yi個url。
該演算法關鍵是需要將業務程序名集和url程序名集轉換成數值相似性集合,便於聚類分析。
1、 首先將終端與對應的業務軟體程序集作關聯性分析;
第i個終端業務程序名數=ki(process_1,…,process_ki),該終端權重=ki/100,分析每個終端與其他終端之間的關聯性(兩個終端之間使用相同程序名的重合度*權重)。首先分析終端1與終端2…終端4000之間的關聯性,依次迭代計算終端之間的關聯性,最後形成終端與使用業務軟體程序之間的關聯度數值矩陣4000*4000。
2、 將終端與url程序集作關聯性分析;
第i個終端訪問url數=mi(url_1,…,url_mi),該終端權重=mi/16000,分析每個終端與其他終端之間的關聯性(兩個終端之間使用相同程序名的重合度*權重)。首先分析終端1與終端2…終端4000之間的關聯性,依次迭代計算終端之間的關聯性,最後形成終端與使用業務軟體程序之間的關聯度數值矩陣4000*4000。
3、 將兩個關聯性數值矩陣組合形成4000*8000的矩陣;
4、 根據這個矩陣採用聚類演算法進行終端相似性聚合。
排名 rank 演算法文件集合
看到乙個系列文章,值得好好研究一下。基於使用者投票的排名演算法 一 delicious和hacker news 基於使用者投票的排名演算法 二 reddit 基於使用者投票的排名演算法 三 stack overflow 基於使用者投票的排名演算法 四 牛頓冷卻定律 基於使用者投票的排名演算法 五 威...
聚類演算法 近鄰聚類演算法
time is always too short for those who need it,but for those who love,it lasts forever.dracula untold 近鄰聚類法同樣是一種基於距離閾值的聚類演算法。coding utf 8 近鄰聚類演算法的pyth...
聚類演算法 層次聚類演算法
層次聚類演算法 hierarchical clustering method 又稱為系統聚類法 分級聚類法。層次聚類演算法又分為兩種形式 凝聚層次聚類 首先將每個物件作為乙個簇,然後合併這些原子簇為越來越大的簇,直到某個終結條件被滿足。層次聚類 首先將所有物件置於乙個簇中,然後逐漸細分為越來越小的簇...