年後有兩門課要考試,再加上摸摸魚。。就到現在了。
這次打算從畢業設計會用到的幾個簡單的開源庫開始分析,最後分析opencv的。
目標演算法:svm
使用到開源庫自帶的例程svm-train,使用的資料是package中自帶的心率資料(heart_scale).
資料集特徵:271個資料點,標籤為正負1,資料維度為13維
訓練方式:./svm-train heart_scale
優勢:具有較多備選資料集,資料集格式統一,支援多形式的svm演算法
(libsvm is an integrated software for support vector classification, (c-svc, nu-svc), regression (epsilon-svr, nu-svr) and distribution estimation (one-class svm). it supports multi-class classification. )
,基於c語言實現,便於插樁分析。
目標演算法:kmeans,pca
這是乙個開源的c++庫,提供線性代數和科學計算方面的幫助。
pca演算法:(需要使用給定的庫和函式進行簡單程式設計)
#include #include using namespace std;
using namespace arma;
int main(int argc, char** ar**)
means.print("means:");
return 0;
}
上述**就是生成乙個資料量為10000,維度為5的隨機向量資料集,然後進行kmeans聚類的過程。
優勢:只提供c++庫函式實現,資料集選擇靈活。
目標演算法:小型神經網路
1.基於mnist資料集的數字識別,使用mnist資料庫進行類lenet-5卷積神經網路的訓練
2.基於cifar-10資料集的目標分類(訓練生成的神經網路較大,作為備選項)
1.kmeans
,資料隨機生成。
2.logistic回歸
,使用節選的iris資料集
3.pca
,對給定的進行主成分分析
4.可選多種演算法的點分類
,由執行程式者自行設定具有0,1標記的點,隨後程式使用平凡貝葉斯分類器,knn,svm,決策樹,ada boost演算法,隨機森林,人工神經網路,最大期望值演算法進行點分類並輸出圖形化訓練結果。
5.可選多種演算法的字母識別
,使用的資料集是來自uci倉庫的字母識別資料集(letter-recognition.data),可選演算法有隨機森林,提公升方法(boosting classifier),多層感知機,knn,svm等。
常見機器學習演算法總結
機器學習演算法主要分為以下2種 有監督與無監督。再細分可分為四種 分類,聚類,回歸,關聯四大類演算法。分類與回歸屬於有監督學習。聚類與關聯屬於無監督學習。分類演算法主要有knn,決策樹,樸素貝葉斯,svm,邏輯回歸,adaboost演算法。knn演算法 基於距離進行分類,選取前k個最相似的樣本,看這...
常見機器學習演算法優缺點
1 線性模型 形式簡單 易於建模 很好的可解釋性 2 邏輯回歸 無需事先假設資料分布 可得到近似概率 對率函式任意階可導的凸函式,許多數值優化演算法都可直接用於求取最優解 3 線性判別分析 lda 當兩類資料同先驗 滿足高斯分布且協方差相等時,lda可達到最優分類 4 boosting 代表adab...
基本機器學習演算法C 庫 畢設筆記3
花書上對基本機器學習演算法是按照有監督學習演算法和無監督學習演算法分類的 無監督學習演算法 主成分分析,k 均值聚類,k近鄰分類 k nn 有監督學習演算法 logistic回歸演算法 邏輯回歸 svm 支援向量機 拓展內容是是核函式 決策樹,線性判別分析 lda 現在是打算先找一找這些演算法有沒有...