1000個正樣本,1000個負樣本
將影象歸一化至24x24
選取了10個特徵模板:
harrlike=[1 -1];
harrlike=[1 -1].';
harrlike=[1 -1 1];
harrlike=[1 -1 1].';
harrlike=[0 1;-1 0];
harrlike=[1 0;0 -1];
harrlike=[1 -1;-1 1];
harrlike=[1 1 1;1 -1 1;1 1 1];
harrlike=[0 0 1;0 -1 0;1 0 0];
harrlike=[1 0 0;0 -1 0;0 0 1];
每個樣本提取特徵數量1909個
訓練錯誤率可以下降至5%以內,但測試錯誤率卻在20%以上,相差非常大,並且收斂緩慢
猜測原因:
1、harr-like特徵不適合於進行潰瘍病
2、歸一化影象大小不合適(太大或者太小)
3、harr-like特徵特徵模板不合適
4、提取特徵數量太少
準備暫時放棄使用harr-like特徵。主要原因在於
1、效果較差
2、訓練花費時間太長(因為特徵維數太高)
把其他特徵空間的特徵提煉完畢後,再來考慮harr-like特徵。
處理分型別特徵
類別型特徵的原始資料一般都是字串形式,只有決策樹等少數模型可以處理字串的輸入,對於傳統的模型來說,類別型特徵必須經過處理轉成數值型特徵。一 序號編碼 用於處理類別間具有大小關係的資料。二 獨熱編碼 稀疏向量 三 二進位制編碼 第一步 給每個類別賦予id,第二步 對id進行二進位制編碼。優點 維數少,...
文字分類 特徵選擇
特徵選擇技術的比較 pso,pca和資訊增益 作為與基於pso的特徵選擇的比較,我們利用pca和資訊增益來減少我們問題的特徵空間的維度。主成分分析 pca 51 是一種有用的統計技術,通過減少維數來壓縮資料。它通過遺漏冗餘資訊找到高維資料中的模式並將其轉換為較低維度。pca通過計算協方差矩陣的特徵值...
php 分類樹狀展示效果
我們有時候需要將分類資料按樹狀效果展示出來,能一眼就看出來層級的組織關係,實現如下 注意 我所講的分類為無限極分類 如下的函式所涉及的表欄位名有三個 id pid name 如果有定義名稱不同請查詢分類列表資料時對應給字段取別名對應上 id pid name 比如 你的pid 表欄位名定義為 par...