在進行多分類問題的時候,常常會遇到資料不平衡的狀況,對於多分類問題,常見的loss有categorical crossentroy.
可以考慮手動設定loss權重來增加模型的準確度,將類別較少的類權重增高。在試驗中,用的資料是情感分析label2的資料集,在不加權重f1值為0.53,權重為[1 2 3 1]後f1值為0.55, 權重為[1 2 6 1]後f1值為0.567。
我又嘗試了根據不平衡的資料集定義乙個權重函式,但是效果一般,可能是我的函式有問題的緣故吧,具體可以參考**
有一篇**的思路不錯,可以參考一下*****,具體思路是直接定義乙個擬合f1的loss,或者是擬合prauc的loss,作者也開源了部分**.但是作者沒有開源那個擬合f1的loss函式,有沒有大佬可以復現出來。。。。我測試了一下那個precision_recall_auc_loss,它在二分類問題上表現不錯,但是在多分類問題上效果就不太好。由於我平時有課業很重,這個實驗暫時就擱置了。如果誰有新的想法的,希望能告知我。
總結:還是手動設定權重效果最突出,但是設定為多少往往取決於主觀判斷,沒有乙個很好的量化指標。
類別不平衡問題
詳解類別不平衡問題 盧總 類別不平衡問題的方法彙總 為少數類生成新樣本 smote borderline smote adasyn 整合方法 演算法層面 focal loss 損失函式的權重調整 閾值移動 評價指標 非均衡資料處理 如何學習?隨機降取樣 bagging是萬金油。屬於bagging 假...
類別不平衡資料處理
1 不平衡資料處理教程 1 2 3 4 2 不平衡資料分類演算法 1 over sampling 隨機過取樣 smote adasyn 臨界smote演算法 svm smote等。2 under sampling 隨機欠取樣 enn renn allknn等。3 combination smotet...
類別不平衡資料的處理
1.不平衡學習的基本概念及處理方法分類 重點學習 分類中解決類別不平衡問題 綜述重點 2.學習adacost對adaboost的改進方式 實現基於代價敏感的adacost演算法 3.smote演算法的matlab實現 基於matlab,應用smote演算法對小樣本類進行過取樣 python中可以呼叫...