c. 聚類演算法
概要 距離:包括曼哈頓距離、尤拉距離等等
核函式:核函式的功能就是把資料從低維空間投影(project)到高維空間去
dtw層次化聚類演算法:該主要有兩種路徑:agglomerative和divisive,也可以理解為自下而上法(bottom-up)和自上而下法(top-down)自下而上演算法流程:1. 將每個物件看作一類,計算兩兩之間的最小距離; 2. 將距離最小的兩個類合併成乙個新類;3. 重新計算新類與所有類之間的距離;4. 重複2、3,直到所有類最後合併成一類。
距離計算方法
單鏈結演算法
全鏈結演算法
均鏈結演算法
劃分式聚類方法:k-means及其變體經典k-means演算法流程:1. 隨機地選擇k個物件,每個物件初始地代表了乙個簇的中心;2. 對剩餘的每個物件,根據其與各簇中心的距離,將它賦給最近的簇;3. 重新計算每個簇的平均值,更新為新的簇中心;4. 不斷重複2、3,直到準則函式收斂。
基於密度的聚類:其原理簡單說畫圈兒,其中要定義兩個引數,乙個是圈兒的最大半徑,乙個是乙個圈兒裡最少應容納幾個點。
dbscan
基於網格的聚類
基於模型的聚類演算法:這一類方法主要是指基於概率模型的方法和基於神經網路模型的方法,尤其以基於概率模型的方法居多。
基於約束的聚類
基於模糊的聚類方法
基於粒度的聚類方法
量子聚類
核聚類譜聚類
人工智慧 聚類 筆記
聚類涉及到資料點的分組,給定一組資料點,我們可以根據聚類演算法將每個資料點劃分為乙個特定的組。同一組中的資料點應該具有相似的屬性或特徵,不同組中的資料點應該具有高度不同的屬性或特徵。聚類是一種無監督機器學習的方法 沒有標籤 或許多領域中常用的統計資料分析技術有時候作為監督學習中稀疏特徵的預處理,有時...
人工智慧 A演算法
在狀態空間搜尋中,如果每一步都利用估價函式f n g n h n 對open表中的結點進行排序,則稱a演算法。它是一種為啟發式搜尋演算法。演算法型別 把初始結點s0放入open表中,f s0 g s0 h s0 如果open表為空,則問題無解 失敗退出 把open表的第乙個結點取出放入closed表...
C 人工智慧 監督演算法
c.監督演算法 資料 離散型 連續性分類演算法 k近鄰演算法knn 貝葉斯樸素貝葉斯演算法 拉普拉斯平滑 為了避免屬性攜帶的資訊被訓練集中未曾出現過的屬性值所干擾。半樸素貝葉斯分類器 bayesian belief network bbn 線性分類 logistic回歸演算法 二分類多分類 一種改進...