CTR預估(2) 邏輯回歸

2022-08-23 08:30:12 字數 1400 閱讀 1803

1、前面的知識基礎

關於ctr**:

常用的模型就是邏輯回歸,線性**可以直觀的反應出各個變數在**中的權重比較有利於運營部門,大約70%的模型都是採用邏輯回歸模型。

首先就是從使用者資訊廣告資訊以及上下文資訊中提取出特徵來然後進行訓練。

2、數學基礎

區域性最優解如何成為全域性最優解?對於凸函式來說以上問題成立:

什麼是凸函式?如何判斷某個函式是不是凸函式?

1、從定義上判斷,只適用於簡單的函式

2、從函式的二階導數判斷,(二階導數大於0)

3、組合函式的判斷

當函式是多維函式時:需要判斷其海森矩陣:

psd 半正定矩陣;

最大似然函式

3、邏輯回歸模型

線性回歸模型通過sigmoid函式後得出的結果;

關於sigmoid函式:

似然函式:

最後得到邏輯回歸的似然函式:

得到似然函式後需要對齊進行最小化。

最常用的就是梯度下降法;基本上所有的模型都可以使用梯度下降法;

4、特徵提取

使用檔案io進行讀取檔案構成特徵向量,多檔案的向量提取:

首先構成主特徵向量,然後根據主特徵向量中的不同字段進行擴充,比如上面手寫中的使用者資訊中的性別資訊可以使用使用者id號去尋找使用者資訊中的其他的特徵,找到後加入到主特徵向量中,完成特徵向量的擴充。

推薦系統 CTR預估

問題描述 網際網路廣告有多種形式,包括展示廣告 競價排名 上下文廣告。對於按點選付費的廣告,乙個很重要的指標就是廣告點選率 使用者點選的次數 click 展示的次數 impression 本文主要討論的是上下文廣告的點選率預估問題。即,給定乙個網頁 page 和乙個廣告 ad page ad pai...

CTR預估模型之DeepFM

2016年google推出了wide deep模型之後,基本上就成為了各大推薦系統的標配。該模型既能學習到低階的記憶性,又能學習到高階部分的泛化性,所以整體效果來說是比較好的。但是它有個麻煩的地方,那就是wide部分需要較多的特徵工程工作。這一點對於人員緊張的小廠來說還是不太方便。而fm具有自動學習...

CTR預估系列模型漫談

了解fm模型之前,需要先說一下lr帶入一下場景。lr作為早期ctr預估裡面的模型,其速度上有著無可比擬的優勢,而偏偏ctr場景下伴隨著有大量的離散特徵,高維稀疏特徵,這個很適合lr的場景。lr整個模型可以被描述為乙個公式 y w 0 sum w i x i lr的特點就是簡單高效速度快可解釋性強,但...