在進行資料法分析之前,一定要明確要對什麼進行資料分析,為什麼要資料分析,怎樣分析,這是一切分析工作的源頭。
可以使用的方法:邏輯樹
邏輯樹的主要思想:將問題分層羅列,對問題進行分層,逐步向下擴充套件。
邏輯樹的原則
例:問題:提公升利潤增速
可以拆解為三個方面的問題:收入、成本、**
收入可以拆解為:主營業務收入狀況、營業外收入狀況等
成本可以拆解為:產品材料成本、人工成本、廣告成本等
**可以拆解為:同行業其他企業的的**、本企業當前的**、這種產品的歷史**波動情況等
還可以繼續拆分,在這裡就不繼續拆分了,原理都是一樣的,就是根據每一層的問題進行細化思考,找到解決方案
需要了解經典的資料分析方法,如5w2h法
5w:why、what、who、when、where
2h:how、how much
例:收集使用者購買電腦產品的資料
why:為什麼購買電腦,為什麼選擇這個產品
what:這個產品有什麼特點,能給使用者提供什麼功能
who:購買此型別電腦的使用者是什麼人,這些使用者有什麼特點
when:使用者是什麼時候購買的,使用者的購買頻率是怎樣的
where:使用者在**購買的,這家店鋪有什麼特點
how;使用者是怎樣購買的,是怎樣支付的,使用者對此產品的體驗是怎樣的
how much:使用者是以多少錢購買的
可以將業務資訊劃分為三個層次
使用者的資料、對手的資料、產品的資料
特點:總體數量有限;
樣本必須在總體中逐個抽取;
總體中的單位被抽為樣本的概率相同
不足:事先要對樣本進行編號,需要耗費大量時間;
若總體分布不均,樣本也會分布不均;
樣本較少時,會影響結果的準確性;
當已知樣本的某些特徵會影響結果時,便不能再使用
類別:包括重複抽樣、非重複抽樣兩種
概念:可以在分為不同層級的樣本中,按一定比例從不同層級中隨機抽取一部分樣本
優點:通過劃分層級,增加了各單位之間的共同性;
容易得出更具有代表性的樣本,使結果誤差較小
步驟:1.根據樣本的特徵,對總體劃分層級,如性別、年齡段、教育水平等
2.確定各層級在總體中的比例,按比例確定抽取各層級中的樣本數量
3.按簡單隨機抽樣的方法抽取樣本
概念:將總體分為許多群,這些群按照一定規則由樣本單位結合而成,通過簡單隨機抽樣抽取其中的某個或某幾個群
步驟:1.確定分群標記
2.按標記分群
3. 確定抽取群數
4. 用簡單隨機抽樣抽取確定的群數
缺點:不同群的差異大,引起的誤差比分層抽樣大
概念:將總體所有單元按一定順序進行排列,再按簡單隨機抽樣抽取第乙個樣本單元,再抽取其餘樣本單元
型別1.隨機起點抽樣
將總體分為k段,k=總體數/樣本數
在每一段隨機位置抽取樣本
缺點:當隨機抽取的樣本位置位於該段首尾位置時,會導致後續單位發生偏離,產生誤差
2.半距起點系統隨機抽樣
與1相同,只不過在第一段以中間項為起點,每個k個單位抽取乙個樣本
3.隨機起點對稱系統抽樣
原理:第一段選f位置的單位,在段數為奇數的段選nk+f位置的單位,在段數為偶數的段選擇nk-f+1位置的單位
優點:保證樣本不偏向,以抵消抽樣誤差
4.迴圈系統抽樣
在k不是整數時,將所有樣本按一定次序排列成首尾相接的迴圈,從第一段抽乙個作為起點,每隔k個距離抽乙個
資料分析 如何收集資料
拿到一堆資料不知道怎樣分析 解決思路 可以從資料使用者的角度出發,得到資料分析的切入點。1.為什麼要做這項資料分析 如客戶想知道商品的定價是否合理,就應收集本公司的商品 資料,同時也要收集同行業其他公司的 資料以及相關行業的 資料,對客戶進行調查,以確定商品定價是否在合理範圍內。2.資料從 來 應當...
formdata收集資料
通常在收集表單的時候我們都要涉及到繫結上傳附件,這時候就可以用formdata的形式攜帶檔案流上傳給伺服器。formdata是ajax2.0 xmlhttprequest level2 新提出的介面,利用formdata物件可以將form表單元素的name與value進行組合,實現表單資料的序列化,...
rcp收集資料上傳
windmeup2011年05月17日 10 36 感謝總版 setorigin 這個我之前也試過.但在createpartcontrol中setorigin 表現的不正常,我推測原因可能是因為此時editor的元件真正的布局還沒有完成.現在我改在乙個ipartlistener中監聽opened事件...