機器學習之特徵組合 特徵交叉

2021-09-01 00:15:36 字數 518 閱讀 2773

特徵交叉是資料特徵的一種處理方式,通過特徵組合的方式增加特徵的維度,以求得更好的訓練效果。

在實際場景中,我們常常遇到這要的情況,線性分類起無法在如下樣本中(無法畫一條直線將下列黃點和藍點分開),所以特徵組合是一種讓線性模型學習到非線性特徵的方式

例如在廣告模型中用到了大量的特徵組合,因為lr是廣告推廣中最常用的模型,但lr本身不夠複雜,為了使得lr學到更複雜的非線性特徵,常常使用原始特徵加上特徵組合的方式。

下一章詳細講解fm、ffm的思想。

fm(factorization machine)主要目標是:解決資料稀疏的情況下,特徵怎樣組合的問題。

fmm: 在fm模型中,每乙個特徵會對應乙個隱變數,但在ffm模型中,認為應該將特徵分為多個field,每個特徵對應每個field分別有乙個隱變數。

特徵工程 特徵交叉 交叉特徵 特徵組合

關於特徵交叉的作用以及原理,我這裡不進行詳細描述,因為大佬們已經說得很清楚了,這裡就附上幾個連線 特徵組合 特徵交叉 feature crosses 結合sklearn進行特徵工程 對於特徵離散化,特徵交叉,連續特徵離散化非常經典的解釋 下面說怎樣製作和交叉特徵 多項式生成函式 sklearn.pr...

機器學習 之 Hog特徵

方向梯度直方圖 histogram of oriented gradient,hog 特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。它是一種能夠很好地描述影象區域性紋理或邊緣的方向密度分布的一種特徵。hog特徵結合 svm分...

機器學習之特徵工程

在工業界一直流行著一句話,資料的質量決定了模型的上線了,而特徵工程與模型的選擇只是盡可能的去逼近這個上線,當我們在資料無法改變的情況,特徵工程的優化便顯得尤為重要。我們輸入模型中,模型只認識資料,並不知道某一列所代表的含義,例如樹模型,它只會按照一定的規則去不停的分支,並不知道分支所代表的含義,而特...