資料化運營演算法及應用

2021-09-24 19:34:41 字數 2446 閱讀 9077

2.聚類分析

3.關聯規則

4. 其它

目標響應概率

a).巨集觀上,可以理解為特定消費群體整體上的概率或可能性。比如,通過卡方檢驗發現某個特定類別群體在某個消費行為指標上具有顯著性特徵,這種顯著性特徵可以幫助我們進行目標市場的選擇,尋找具有相似特徵的潛在目標使用者,制定相應的細化營銷措施和運營方案。

b).微觀上,概率可以是具體到某個特定消費者的預期響應概率。比如,通過邏輯回歸演算法搭建乙個**響應模型,得到每個使用者的預計響應概率,然後根據運營計畫和預算,抽取響應概率分數高的消費者,進行有針對性的運營活動。

a).包括線性回歸和邏輯回歸,後者在資料運營應用更多

b).原理

多元線性回歸主要描述乙個因變數如何隨著一批自變數的變化而變化,其回歸方程就是因變數與自變數關係的資料反映。因變數的變化包括兩部分:系統性變化與隨機變化,其中系統性變化由自變數引起的,隨機變化是不能由自變數解釋的,通常也稱作殘值。(採用最小二乘法)

邏輯回歸**的因變數是介於0和1之間的概率。簡單來講,凡是**「二選一」事件的可能性都可以採用邏輯回歸(採用最大似然法)

a).特點

適合探索式的知識發掘,並且可以處理高緯度的資料。易於理解,並且對資料的分布和缺失非常寬容,不易受到極值的影響。

b).目前最常用的3種決策樹演算法分別是chaid、cart、id3。

chaid:卡方自動相互關係檢測,依據區域性最優原則,利用卡方檢驗來選擇對因變數最有影響的自變數,該法的應用前提是因變數為類別型變數。

cart:分類與回歸樹,分割邏輯與chaid相同,每一層的劃分都是基於所有自變數的檢驗和選擇上的,不過它採用的檢驗標準不是卡方檢驗,而是基尼係數。

id3:迭代的二分法,基於資訊增益的度量選擇具有最高資訊增益的屬性作為節點的**屬性

c).應用

作為分類、**問題的典型支援技術,在使用者劃分、行為**、規則梳理等方面具廣泛應用。甚至可以作為其他建模技術前期進行變數篩選的一種方法。

a).原理

通過輸入多個非線性模型以及不同模型之間的加權互聯,最終得到乙個輸出模型

b).特點

由於神經網路擁有特有的大規模並行結構和資訊的並行處理等特點,因此它具有良好的自適應性、自組織性和高容錯性,並具有較強的學習、記憶和識別功能。缺點是其結果的不可解釋性,沒有人知道隱蔽層裡的非線性函式到底是如何處理自變數的。

c).應用

訊號處理、模式識別、專家系統、**系統等。使用者劃分、行為**、營銷響應等方面具廣泛應用

a).用來**類成員間關係的可能性,對於分類問題,就是給出x的屬性值,計算出該觀察值屬於類別c的概率

a).針對幾個特定的業務指標,可以將觀察物件的群體按照相似性和相異性進行不同群組的劃分。

b).常用演算法

劃分的方法、層次的方法、基於密度的方法、基於網格的方法、基於模型的方法等。

c).應用

既可以直接作為模型對觀察物件進行群體劃分,為業務方的精細化運營提供具體的細分依據和相應的運營方案建議,又可以在資料處理階段用作資料探索的工具,包括發現離群點、孤立點、資料降維的手段和方法,通過聚類發現資料間的深層次的關係等

a).找出資料集中的頻繁模式,即多次重複出現的模式和併發關係

b).apriori演算法

先生成所有的頻繁專案集。再從頻繁專案集中生成所有的可信關聯規則。

c).應用

文字挖掘、web資料探勘、商品推薦

a).通過線性組合將多個原始變數合併成若干個主成分,這樣每個主成分都變成了原始變數的線性組合

b).目的,一方面可以大幅度降低原始資料的維度,同時也在此過程中發現原始資料屬性之間的關係

c).步驟

先進行各變數的標準化工作

選擇協方差陣或者相關陣計算特徵根及對應的特徵向量

計算方差貢獻率,並根據方差貢獻率的閾值選取合適的主成分個數

根據主成分載荷的大小對選擇的主成分進行命名

根據主成分載荷計算各個主成分的得分

d).將主成分進行推廣和延伸即成為因子分析,因子分析在綜合原始變數資訊的基礎上將會力圖構築若干個意義較為明確的公因子;也就是,採用少數幾個因子描述多個指標之間的聯絡,將比較密切的變數歸為同一類中

主成分分析是因子分析的乙個特例,兩者區別聯絡主要為:

主成分分析會把主成分表示成各個原始變數的線性組合,而因子分析則把原始變數表示成各個因子的線性組合

主成分分析的重點在於解釋原始變數的總方差,而因子分析的重點在於解釋原始變數的協方差

主成分分析中,有幾個原始變數就有幾個主成分,而因子分析中,因子個數可以根據業務場景人為指定

主成分中,給定的協方差矩陣或相關矩陣的特徵值是唯一時,主成分也是唯一的,但在因子分析中,因子不是唯一的,並且通過旋轉可以得到不同的因子

e)應用

主成分分析和因子分析主要用於資料處理、降維、變數間關係的探索等方面。

a).原理

觀測小概率事件在假設成立的情況下是否發生,如果在一次試驗中,小概率事件發生了,那麼說明假設在一定的顯著性水平下不可靠或者不成立

b).應用

常用於運營效果的評估

資料化運營之會員資料化運營

會員資料化運營主要用來解決以下方面問題 1 會員生命週期狀態 2 會員核心訴求 3 會員價值如何 4 會員轉換習慣與路勁 5 如何擴大市場覆蓋 獲取更多會員 6 如何維繫老會員 7 應該在什麼時間 採取什麼措施 針對那些會員做那些活動 8 在特定運營目標下,應該如何指定會員管理措施 會員資料化運營關...

資料化運營 2

第10章 響應 分類 模型的應用和技術小竅門 正如上篇文章所說的本書的重點是商業 模型,本章節中關於演算法的一些描述我覺得有些不妥,例如介紹決策樹 dt 的優缺點的時候,文中指出 如果目標變數是連續型變數,那麼決策樹就不適用了,最好改成線性回歸 其實dt演算法也是可以解決回歸問題的,例如網際網路廣告...

資料化運營 1

前段時間,boss推薦 資料探勘與資料化運營實戰 思路 方法 技巧與應用 買來看了一下,覺得裡面有很多乾貨,儘管有關怎麼建模,如何建模等深入到演算法層面的東西講的比較少,但是該書站在商業化,業務 技術的角度闡釋了該如何做資料探勘,以下我是用思維導圖的方式記錄了的筆記 直接從雲筆記裡面copy過來 第...