決策樹
實現id3決策樹,並在鳶尾花卉iris資料集上進行5折交叉驗證。並觀測訓練所得到的決策樹在訓練集和測試集的準確率,從而判斷該決策樹是否存在過擬合。在此基礎上實現預剪枝和後剪枝,並比較預剪枝樹與後剪枝樹在訓練集和測試集上的準確率。
實現過程:
首先使用importdata將.data檔案匯入到matlab的workspace中,然後用regexp函式將a分割成單獨的乙個個值並儲存到s中。再用str2num函式把字串轉換為數值並儲存到矩陣a中。為了方便起見,把三類鳶尾花的名字在矩陣中儲存時替換為1,2,3。為了後面計算資訊熵時使用,自定義函式「count」來統計每個屬性中每一類的個數,一共三類,其數量分別儲存在變數cout1,count2,count3中。
機器學習之辣雞使用matlab(一)KNN
1.實現最基本的knn演算法,使用trainingdigits資料夾下的資料,對testdigits中的資料進行 k賦值為1,使用歐氏距離,多數投票決定分類結果 2.改變k的值,並觀察對正確率的影響。資料集來自 資料集介紹 digits 目錄下有兩個資料夾,分別是 trainingdigits 訓練...
機器學習matlab
rain data是訓練特徵資料,train label是分類標籤。predict label是 的標籤。matlab訓練資料,得到語義標籤向量 scores 概率輸出 1.邏輯回歸 多項式multinomial logistic regression factor mnrfit train dat...
matlab機器學習庫
knn fitcknn meas,species,numneighbors 5 cvmdl crossval knn kloss kfoldloss cvmdl predict knn,ones 1,size meas,2 latent 特徵值 從大到小 score特徵向量 coeff,score,...