受眾定向 資料加工和交易

2022-07-03 12:09:09 字數 3736 閱讀 8987

因為有受眾定向,ctr會提高,那麼就產生了市場價值,所以市場就產生了資料的加工和交易。一些公司有資料,但它們不一定能資料變現的能力,也不一定對資料變現的業務有介面,那麼就會產生資料的交易。

精準廣告業務可以模擬於提煉汽油的過程。煉油第一步是從油田中抽取**,**在煉油廠提煉成汽油,汽油在加油站售出。精準廣告的原材料是的資料來源,在資料來源上我們得到了使用者行為,即前面提到過的九種行為,定向系統是將非結構化的使用者行為,轉換成廣告主感興趣的使用者標籤,即廣告主願意購買的使用者標籤,標籤比如有:理財,體育,電子等等。ad server(投放機)僅僅是使用標籤的系統。大家可以看到行為定向實際上與使用者定向的關係並不大,它僅僅是使用標籤,更重要的是原材料(使用者行為)和加工過程(定向系統),這也就是資料為什麼會交易,因為它是精準廣告系統中最有價值的部分。反過來說,不是哪個公司營利的多,它的定向系統就一定好。技術就像是煉油廠,它是希望能最大程度的提煉**,而營利主要是由油田的數量決定的,比如你有**,京東的購物行為,變現就會容易的多,即使技術比較差也能賺到很多錢,如果你的資料僅是page view,那麼營利就不那麼容易了。

越精準的廣告,給市場帶來的價值越大

這個觀點個人持懷疑態度,回到第一章我們討論的問題,特別精準的廣告只有兩種做法,即把廣告主的使用者再賣給廣告主,和把廣告主競爭對手的使用者賣給廣告主。這兩種方法並不創造廣告價值,換言之,沒有對潛在使用者的reach,這時候,它不再是乙個廣告,而是乙個營銷渠道,類似於在旅遊景點互相拉客人的行為。

**利益與廣告主利益是相博弈的關係

從短期來講,**利益與廣告主利益是相博弈的關係。比如yahoo!提供的標籤是不多的,它不細分標籤的原因是如果細分會對它的短期利益有傷害,如果僅提供性別標籤,它可以將男性使用者賣給nike,女性使用者賣給dior,但如果分的很細,比如有-1~+1歲嬰兒的母親這種標籤,那麼這種標籤對廣告商是非常有價值的,但問題是很可能沒有廣告商願意買剩下的某些細分標籤使用者,這對**短期有害的,但長期來講,整個市場的利益只有細分,才能創造最大化,才能給廣告主帶來最大的價值。現在的整體趨勢是demand端越來越強,有價值的標籤越來越豐富這個廣告發展。

精準投放加上大資料可以顯著提高營收

營利的提高最後還是依靠銷售,因為精準投放加上大資料,雖然可以把標籤加工的越來越準,但是在廣告主基數不變的情況下,只能是每個廣告主的使用者數變的越來越少,換言之,每個廣告主的roi提高了,但並不是通過提高了return,而是降低了investment。也就是廣告平台不再對無關的使用者展示廣告主的廣告,所以要擴大使用者群只能通用銷售的方法去做,做這種廣告,**有其先天的優勢,因為它掌握著demand端資料。

人群覆蓋率較低的資料**是不需要的

比如retargeting中,人群的覆蓋率很低,大家可能認為沒有什麼效果。但是廣告整體的效果往往就是依靠這樣乙個個覆蓋不高但特別有效的標籤標出來的,再加上競價系統的啟用,才使得整體廣告系統的市場的流動性和收益變大。

不同的廣告產品應該採用不同的投放機

現在講這個可能有些早,因為我們只講了合約式廣告產品一種,後面還有競價廣告和exchange,這些演算法還是一些不同的,直接的想法是分別實現不同的投放機,但到ssp的時候,無論是rtb,還是cpm,還是競價售賣的方式,最好還是在一起決策,這樣才能最好的優化supply的利益。

前面我們提到的是對行為定向有用的資料,但值得交易的資料還有很多。

使用者標識

使用者行為

業界公認有效行為資料(按有效性排序):「交易,預交易,搜尋廣告點選,廣告點選,搜尋,搜尋點選,網頁瀏覽,分享,廣告瀏覽」,需要注意的是網頁瀏覽是乙個被動行為,熱點話題應該去掉。越靠近demand的行為對轉化越有貢獻,越主動的行為越有效。

廣告商(demand)資料

如果對廣告效果來講,它是資料的核心。簡單的cookie植入可以用於retargeting。對接廣告商種子人群可以做look-alike,提高覆蓋率。

使用者屬性和精確地理位置

非**廣告網路很難獲取,需通過第三方資料對接。移動互聯和html5為獲得地理位置提供了便利性。

社交網路

實名社交網路的人口屬性資訊相對準確,當乙個使用者的屬性未知時,可以通過好友關係鏈推測出他的使用者屬性。

關於dmp(data management platform)的定義,大家的看法往往不同。dmp有幾項主要的業務功能,1. 為**提供資料加工和對外交易能力,即將**的資料管理起來,加工成標籤,標籤給**使用,也可以**。2.對於google finance和yahoo! finance的使用者,他們都會被打上finance標籤,如果dmp接入不同的**,它就可以跨**加工使用者標籤,這就比只加工單個**的資料,標籤更準確,這種標籤在交易市場中是有公司有興趣購買的。dmp是否應該直接從事廣告交易存在爭議,audience science的人認為直接參與廣告交易,它本身才有利潤空間,而bluekai的人認為,將標籤放到exchnage中售賣就可以了,但它的利潤是比較薄。

dmp的關鍵特徵有:1. 定製化使用者劃分,dmp自己加工使用者標籤是因為它可以針對不同的**加工不同的標籤。2. 統一的對外資料介面,比如在retargeting中,乙個**要接多個exchange,那麼**網頁**中就要加入不同exchange的js**,而使用dmp,就可以直接把人群已經加工完成了,那無論哪個exchange來對接的時候,就可以通過dmp交給exchange,這對exchange也是有好處的,要在乙個**上做retargeting,在剛開始的時候,收集到的使用者並不多,大約在三個月才能把使用者收集完成,如果dmp已經加工完成使用者了,在exchange接入後,可以直接使用所有使用者資訊了。

代表公司有bluekai和audience science。

dmp在架構中的位置在圖中已經標出,它主要是執行乙個data highway,把各種各樣的資料收集起來,比如它對接了十家**,那麼十家**的資料都通過它的data highway到計算平台上,它做兩件事,1.做audience targeting,即給使用者打標籤,2. 將標籤放在在一些可以對外售賣的體系中,比如adexchange中。它也可以對上下文提供標籤,它屬於離線挖掘的部分,作用是綜合各**的資料為主。

個人工作中常用的是facebook的scribe這個data highway,它提供大規模分布式日誌收集功能,比如伺服器會產生多種日誌,廣告投放系統日誌,點選日誌,我們希望可以在幾分鐘內收集到這些日誌流到hadoop或是storm上,進行資料探勘,我們可以用scribe。它可以準實時收集大量日誌到hdfs,得用thrift實現底層服務。

類似的工具有常用的flume,和chukwa。

bluekai的核心業務主要是接入中小**後提供給它們資料加工和變現的方式。比如有一家賣服裝的小**,它有自己使用者的搜尋行為,購買行為,但它的資料量不大,不值得用這些資料去分析變現,bluekai就會與這些中小**合作,通過匯聚眾多中小**使用者資料和行為資料,加工成受眾定向標籤,通過data exchange對外售賣。比如某些dsp想知道使用者身上有什麼標籤,而它又沒有使用者資訊,就可以向bluekai購買或分成,bluekai再向**分成。bluekai是完全的資料加工的公司,它與廣告的關係不大。

bluekai提供大量細分的類別,它有著開放體系上的標籤,如「對寶潔洗髮水感興趣的人」,「想去日本旅遊的人」,這些非常精細類目對於要做效果廣告的廣告主來說非常有意義,所以它的售價也很高。與之相對的是yahoo!的廣告類目,只有幾十個大類。bluekai靠資料**變現,並與提供資料的**分成,並不直接運營廣告業務。bluekai也注意到了隱私的問題,它提供了乙個介面,使用者可以看到自己的資料被誰使用,也可以選擇「捐給慈善機構」。

計算廣告學習筆記3 5 受眾定向 資料加工和交易

來自於師徒網 劉鵬的講課,確實不錯,筆記記錄一下 有資料的未必有資料變現的能力,所以導致這些業務的出現。類似於乙個煉油的過程 第一條,所謂的精準只是把你的客戶賣給你或者把別人的客戶賣給你,不會吸引到潛在的客戶,類似於前面講的吃飯拉客的例子。第二條,短期看,分的越細,對 有傷害,長期來看,應該是互惠的...

計算廣告讀書筆記(六) 資料加工與交易

1.有價值的資料 關於行為資料對廣告效果的意義,有兩條基本規律 使用者主動意圖的提公升,相應的行為資料價值越大 越接近轉化的行為,對效果廣告的精準指導作用越強。資料型別主要包括以下幾類 對於瀏覽器行為,我們最常使用的使用者標識是cookie 在移動互聯的情形下,ios使用idfa identifie...

字王看 大資料和高頻量化交易

字王看 大資料和高頻量化交易 這個原本是和國內一家做高頻量化公司boss溝通時的寫的,修改了一下,作為blog和zwpython的大資料資料,發布了 關於大資料 高頻交易和人工智慧,我的基本觀點 凡是無法通過 足彩資料 進行實盤測試的方案 演算法,都是在耍流氓。高頻量化交易個人觀點 1 採用2 3個...