廣告技術是獨特的,有自己獨特的要求和限制。數字廣告正越來越多地通過程式化的方式進行交易,這就要求技術不僅能夠適應極端的資料量,而且能夠以實時數字業務的速度處理資料。問題是,僅憑「大資料」就能滿足廣告技術行業的所有需求嗎?
數字廣告的聖杯是在正確的時間和地點,通過正確的資訊到達正確的消費者。跟蹤營銷預算的投資回報和正確的歸因也很重要。挑戰在於找到合適的技術來挖掘資料,並將其有效地處理成可**的資產;正是提煉過程使原始資料變得有價值。在構建平台時,我們定義了三個必須執行的區域:
1、資料量
2、即時決策
3、可控成本
資料量
在廣告技術領域,成功的客戶參與需要對大量複雜資料進行閃電般的查詢。我們必須能夠容納更大的資料集,並向最大的客戶交付更複雜的交易和服務。部署必須足夠靈活,以提供成本效益高、易於使用的服務。我們希望通過流式資料分析和精簡的機器學習,讓我們的客戶能夠以無與倫比的速度將大量複雜資料轉化為數字洞察力。為了實現這一目標,我們將大資料平台擴充套件為以加速平行計算為核心的新技術。kinetica是乙個圖形處理單元(gpu)驅動的資料庫,提供高速資料處理能力,pubmatic可以授權給我們的客戶實時匯報和乙個複雜的廣告節奏引擎。
單是大資料就能跟上廣告技術的步伐嗎
程式化交易的規模相當大,pubmatic每天生成超過400兆兆位元組的未壓縮資料,每月處理超過10萬億的廣告商投標。然而,與其他行業相比,每筆交易的價值相對較低。因此,每筆交易的成本必須低於許多其他行業;這意味著基礎設施的足跡必須更小。廣告技術行業在定義下一代資料平台方面處於領先地位,該平台能夠以更低的每位元組需求成本處理大量資料集。我們相信採用我們的技術標準只會對每個人的底線產生積極的影響。
成功的關鍵是找到解決問題的正確方法。數字廣告是在極端資料領域運作的,在極端資料領域,一切都與數量、速度和成本有關。資料量的增加是不可**的,但成本是不可**的。雖然人們很容易沉迷於熟悉的技術,但僅憑大資料還不足以跟上廣告技術的步伐。
大資料概念 大資料的技術生態比喻
的廚具可以處理所有情況,因此它會變的越來越複雜。hbase 是乙個高可靠性 高效能 面向列 可伸縮的分布式儲存系統,利用hbase技術可在廉價pc server上搭建起大規模結構化資料集群。像facebook,都拿它做大型實時應用 facebook s new realtime analytics ...
大資料(二)大資料相關的技術
大資料常和雲計算聯絡到一起,因為實時的大型資料集分析需要分布式處理框架來向數 十 數百或甚至數萬的電腦分配工作。可以說,雲計算充當了工業革命時期的發動機的角色,而大資料則是電。雲計算思想的起源是麥卡錫在上世紀 60 年代提出的 把計算能力作為一種像水和電一樣的公用事業提供給使用者。如今,在 goog...
大資料的關鍵技術
在大資料時代,傳統的資料處理方法還適用嗎?大資料環境下的資料處理需求 大資料環境下資料 非常豐富且資料型別多樣,儲存和分析挖掘的資料量龐大,對資料展現的要求較高,並且很看重資料處理的高效性和可用性。傳統資料處理方法的不足 傳統的資料採集 單一,且儲存 管理和分析資料量也相對較小,大多採用關係型資料庫...