機器學習中容易出現的誤區

2021-09-27 10:55:23 字數 558 閱讀 4037

在機器學習中很多人都可能有一定的誤解,那就是認為複雜的事物容易出錯,而簡單的事物往往會得到極高的準確率,那麼事實真的是這樣的嗎?在這篇文章中我們詳細的給大家介紹一下這個問題,並給大家介紹一下特徵的相關知識。

其實簡單並不意味著準確。在機器學習中,這通常意味著,給定兩個具有相同訓練錯誤的分類器,兩者中較簡單的可能具有最低的測試錯誤。有關這一說法的證據在文獻中經常出現,但事實上有很多反例,比如「天底下沒有免費的午餐」定理也暗示它不可能是真的。

而特徵工程的重要性大家也是知道的,一般來說,特徵選擇也叫特徵子集選擇。是指從已有的 m 個特徵中選擇 n 個特徵使得系統的特定指標最優化,是從原始特徵中選擇出一些最有效特徵以降低資料集維度的過程,是提高演算法效能的乙個重要手段,也是模式識別中關鍵的資料預處理步驟。而特徵提取是計算機視覺和影象處理中的乙個概念。它指的是使用計算機提取影象資訊,決定每個影象的點是否屬於乙個影象特徵。特徵提取的結果是把影象上的點分為不同的子集,這些子集往往屬於孤立的點,連續的曲線或者連續的區域。

關於機器學習中存在的誤解我們就給大家講到這裡了。由此可見,機器學習是乙個十分嚴謹的內容,容不得一點馬虎,所以我們還是需要注意好資料的準確性。

機器學習中容易出現的誤區

在機器學習中很多人都可能有一定的誤解,那就是認為複雜的事物容易出錯,而簡單的事物往往會得到極高的準確率,那麼事實真的是這樣的嗎?在這篇文章中我們詳細的給大家介紹一下這個問題,並給大家介紹一下特徵的相關知識。其實簡單並不意味著準確。在機器學習中,這通常意味著,給定兩個具有相同訓練錯誤的分類器,兩者中較...

python3中 for迴圈容易出現的問題

j 0 for i in range 5 i 1 j i print j 按照 c 的 想法來來編寫 的話,就會寫出以下 for int i 0 i 5 i print j 按照我的想法,這兩個輸出一定會一致,實際上這兩個輸出完全不同。python 15c 9其實查過python的文件就知道,在py...

Gson使用中型別轉換容易出現的問題

最近在專案中使用gson將json串轉成map,發現乙個int或long型別字段轉換後會。造成與其他系統聯調時造成bug。因此,這裡將gson與fastjson轉換做個比較 long a 201800l long b 201900l mapmap new hashmap map.put a a ma...