資料分析雜談
筆者只是乙個客戶端工程師,不是專業的資料分析師,只是碰巧在工作中與資料打交道比較多,做過客戶端的資料傳輸sdk,客戶端無埋點sdk,寫過hive指令碼,也折騰過spark,也做過不同通道資料的差異分析,僅此而已。本文試圖從筆者自身有限的經歷中,給大家普及些資料分析的入門知識。
分割線——————————————————————————
什麼是資料分析?資料分析說白了就是讓資料變成生產力的一部分,是從海量的資料中窺視背後的業務邏輯,尋找出新的業務增長目標,或者及時發現業務潛在的問題。資料分析其實是服務於業務需求的,脫離了業務需求的資料分析就是在「打黑工」。
本文會嘗試從資料分析的流程,分析技能,名詞,指標體系,分析方法,商業化模型幾個方面簡要介紹資料分析涉及到一些知識。
資料分析流程是乙個思維框架,主要幫助和指導我們如何去做資料分析。目前業務資料分析標準流程為crisp-dm(cross-industry standard process for data mining)
資料分析wiki;整個分析流程分為六個部分
如特徵描述,分布特性
所有的資料分析問題,不管是技術資料,還是產品資料都可以按照這個流程去進行分析,該流程可以很清晰地指導每一步需要做什麼,不會毫無頭緒,不知道從**入手去進行分析;
資料指標體系是指針對一種具體的業務場景,為了完成該場景的分析目標(分析問題和解決問題),搭建的技術體系,將業務的不確定性的描述轉化為確定性的資料描述。
我們在建立資料指標體系時,最好需要包含乙個指標文件,文件裡需要有以下內容:
資料分析需要具備一定的理論知識和分析思維
概率分析:離散概率分布,連續概率分布;
統計推斷:置信區間、假設檢驗、抽樣
rfm(recency,frequency,money)模型一般是用於篩選出需要重點運營的使用者:
一般可以通過對rfm資料進行標準化標準化,把rfm模型變為打分模型,通過可以有效圈選出可持續運營的高質量使用者
作用:找到增長的切入點,拉新,提頻,收入;
可以通過對使用者行為資料的分析,對使用者進行分類,進而視當前產品所處階段,採用不同的運營手段;
資料分析 資料分析概述
了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...
資料分析 資料分析的誤區
在資料分析的過程中,我們難免會走一些彎路,但有些彎路是可以避免的,下面我將介紹幾個資料分析過程中常見的誤區 我們一定都聽說過二戰中的乙個經典示例 軍方為了提高戰鬥機飛行員的生還率,打算在飛機上增加裝甲的厚度,但不能在所有部位加厚,這樣會喪失戰機的靈活性,於是軍方請了統計學家來研究,這些專家在一開始就...
「資料分析」崗位分析
行業內公司的融資情況從一定程度上說明了選擇資料分析崗位的穩定性 佔比情況是所有職位累加在一起,未區分職位 不需要融資的公司佔比60 d輪以上的公司42 其實很多不需要融資的公司,規模也是很大的,可以結合公司規模來判斷公司的情況如何,是否值得去發展。提供資料類職位的公司,規模還算比較大的 500人以上...