(1)分布分析
用來解釋資料的分布型別和分布特徵,顯示其分布情況。
求極差 -->決定組距與組數-->決定分點-->繪製頻率分布圖
根據變數的分類型別來確定分組,然後使用圖形對資訊進行顯示
(2)對比分析
對比分析是指把兩個相互聯絡的指標進行比較,從數量上展示和說明研究物件規模的大小、水平的高低、速度的快慢,以及各 種關係是否協調。特別適用於指標間的橫縱向比較、時間序列的比較分析。在對比分析中,選擇合適的對比標準是十分關鍵的 步驟,選擇合適,才能做出客觀的評價,選擇不合適,評價可能得出錯誤的結論。
利用這組指標絕對數進行對比,從而尋找差異的一種方法。
它是由兩個有聯絡的指標對比計算的,用以反映客觀現象之間數量聯絡程度的綜合指標,其數值表現為相對數。由於研究目的 和對比基礎不用,相對數可以分為以下幾種:結構相對數、比例相對數、動態相對數和空間相對數
(3)統計分析
對一組資料用統計指標定量的分析資料,一般從集中趨勢和離中趨勢兩個方面來衡量資料。
統計平均數可分為,①算術平均數、加權算術平均數②位置平均數。
可用極差與分位差、方差與標準差、離散係數 等衡量。
(4)帕累託分析
帕累託分析又叫貢獻度分析,原理是20/80定律,即80%的利潤常常來自於20%的產品。一般來說投入產出,努力和報酬之間 並不是絕對的線性關係,總有一些關鍵因素起著至關重要的作用,而帕累託分析就是找到影響事務的關鍵因素,分清主次。
(5)相關性分析
相關性分析是研究兩個或兩個以上處於同等地位的隨機變數間的相關關係的統計分析方法。例如,人的身高和體重之間;空氣 中的相對濕度與降雨量之間的相關關係都是相關分析研究的問題。相關分析與回歸分析之間的區別:回歸分析側重於研究隨機 變數間的依賴關係,以便用乙個變數去**另乙個變數;相關分析側重於發現隨機變數間的種種相關特性。可用相關係數r來衡 量兩個特徵之間的相關性。
相關性也包括正相關、負相關、和不相關。
總之:對於乙份資料可以從以上幾個方面來進行分析,找資料中的特徵。常常採用各種工具可以進行繪圖視覺化來發現其中的特徵,但是無論如何理論基礎不可少。比如面試時候,你能說出要從分布情況、資料對比、統計分析、各個屬性貢獻度分析(帕累託分析)、甚至不同屬性之間的相關性分析,並從多維度,多層次給出一些相對準確的結果,都會為你的面試加分呀。最後多囉嗦一句,方方面面都要分析到呀,給出的資料為啥有這些屬性,不會是白給的(心酸來自於之前的一次面試,讓分析的是遊戲資料,包括使用者解除安裝時各個維度資料,自以為是的覺得其中的兩個屬性(國家和手機型號)對結果(使用者解除安裝遊戲)沒啥影響就自動忽略了,然後,就沒有然後了,涼涼了)。
資料分析方法
對比分析 多維度分析 分布分析 使用者留存 漏斗觀察 使用者畫像 歸因查詢 路徑挖掘 行為序列 比什麼 絕對值 vs 比例值 怎麼比 環比 vs 同比 和誰比 和自己比 vs 和行業比 運作原理 指標 業務流程需要按照多維度拆分,來觀察變動 適用場景 分析單一指標的構成 針對流程進行拆解 如 不同渠...
資料分析 方法 工具
如下摘自 完整的資料分析流程一般如下圖 資料分析方 一定是為指導具體工作實踐而服務的,所以僅僅掌握方 並不夠,還要通過實踐不斷完善優化方法,也要借助工具,雙管齊下,才能達到最好的效果。波動解釋型 某天的銷售額突然下降了,某天的新使用者留存突然降低了,這時候往往需要分析師去解釋波動的原因,分析較為聚焦...
常用資料分析方法
自 一 描述性統計 描述性統計是一類統計方法的彙總,揭示了資料分布特性。它主要包括資料的頻數分析 資料的集中趨勢分析 資料離散程度分析 資料的分布以及一些基本的統計圖形。1 缺失值填充 常用方法有剔除法 均值法 決策樹法。2 正態性檢驗 很多統計方法都要求數值服從或近似服從正態分佈,所以在做資料分析...