1. 擴大資料集。俗話說的好,更好的資料往往能打敗更好的演算法。當我們想要提高機器學習的分類準確率時,第乙個可用的方法就是擴大資料集。只要機器學習花費的時間在可以接受的範圍內,就可以繼續擴大資料集,它往往可以使我們獲得更理想的分類準確率。
2. 分類器選擇。遺憾的是,理想的資料集規模往往是我們可望不可即的。這時,我們應該想到的就是選擇適合的分類器。以weka為例,如果你使用的訓練集較小,那麼高偏差/低方差分類器(如樸素貝葉斯)將會是你較優的選擇。然而,隨著訓練集的增大,低偏差/高方差分類器(如k近鄰)將提供更好的分類結果,因為它們具有較低的漸近誤差,而高偏差分類器則不足以提供準確的模型。此外,資料的各個屬性是離散值還是連續值,資料雜訊的大小等都可以成為選擇分類器的依據。
3. 屬性子集選擇。好馬需配好鞍。在我們選擇了合適的分類器後,還需要進行的一項工作就是資料屬性子集的選取,也就是選出那些與類別屬性相關性較強的,去除不相關和冗餘的屬性。這項工作如果人工來做的話,是十分複雜且困難的。不過,好在很多機器學習工具都為我們提供了這項功能,還以weka為例,它為我們提供了乙個工具——屬性評估器。屬性評估器分類兩類:一是屬性子集評估器,它的作用是為我們返回乙個「最優」(是否真的最優,還需進行驗證)的屬性子集。二是單個屬性評估器,它通過將給定數目的屬性進行排序,得到了乙個直觀的屬性排名列表,我們可以自己把那些排名靠前的屬性選出來,並用它們進行分類,從而提高準確率。
5. 演算法改進。這點非常難,尤其是在機器學習已經發展了那麼多年,無數大牛先後投入其中的情況下,想要改進演算法是我們一般人做不到的。但是,也存在一種可能,就是當我們利用機器學習解決某個特定領域的問題時,也許可以利用我們對該領域知識的掌握,比如該領域資料有何特點,來對某一演算法進行適當的調整,以使得該演算法可以更好地應用在這個領域的資料上,從而獲得更好的效果。如果有哪位朋友有相關的工作經歷或者經驗,也希望您能和大家分享一下。
以上只是我剛剛接觸機器學習後的一點點總結,肯定存在很多錯誤,還希望大家多多批評指正。
如何提高訓練模型準確率
8個經過證實的方法 提高機器學習模型的準確率 摘要 本文分享了 8 個經過證實的方法。這些方法用來改善模型的 表現。它們廣為人知,但不一定要按照文中的順序逐個使用。提公升乙個模型的表現有時很困難。如果你們曾經糾結於相似的問題,那我相信你們中很多人會同意我的看法。你會嘗試所有曾學習過的策略和演算法,但...
提高分類準確率的技術 組合分類
基本思想 組合分類把k個學習得到的模型 或基分類器 m1,m2,mk組合在一起,旨在建立乙個改進的復合分類器模型m 使用給定的資料集d建立k個訓練集d1,d2,dk,其中di用於建立分類器mi。現在給定乙個待分類的新資料元組,每個基分類器通過返回類 進行投票。組合分類器基於基分類器的投票返回類 目前...
提高深度學習分類模型準確率方法
1.增加資料,資料越多越好,深度學習,資料為王。2.增加對抗樣本,這個效果特別好,例如做分類的時候,如果演算法容易把白色桌面識別成雪天,那麼就增加白色桌面的無關類,如果演算法容易把玻璃識別成投影幕,那麼就增加玻璃的無關類,這種方法效果特別好。3.過濾資料,有些資料一張卻包含另一類的物件,比如貓狗分類...