資料統計分析 基本概念 01

2021-07-30 21:27:34 字數 601 閱讀 2421

頻數,定序、定類、定距資料;

定性 vs 定量

定量研究:通過統計調查法或實驗法,建立研究假設,收集精確的資料資料,然後進行統計分析和檢驗的研究過程。

定性研究:

定性是定量的基礎,定量是定性的精確化!

從不同的角度,不同的層面,用不同的方法對同一事物的質進行研究!

乙個是發散思維創造想法,乙個用數字和邏輯驗證想法!

統計分析:統計描述,統計推斷(區間估計,假設驗證)

集中趨勢,離散趨勢!

描述離散趨勢的常用指標有極差、四分位數間距、方差、標準差、標準誤差和變異係數等,其中方差和標準差最常用!

正態分佈 vs 偏態分布

條形圖主要用於展示分類資料,直方圖則主要是用於展示數值型資料!

對於偏態分布,均數受極值影響較大,代表性較差,不適合描述偏態分布的集中趨勢!

極差:最大值和最小值之差!

方差:越大表示離散或者變異程度越大;

四分位數間距,p75 - p25,適合描述任何分布型別的離散趨勢!

變異係數:標準差/均值,相對離散程度;

標準正態分佈:期望為0,標準差為1,的正態分佈;

資料統計分析方法

資料統計分析方法 描述統計 假設檢驗 相關分析 方差分析 回歸分析 聚類分析 主成分與因子分析 時間序列分析 決策樹。回歸分析 研究自變數與因變數之間的關係 可以用來 因變數的值 線性回歸使用最佳的擬合直線 也就是回歸線 在因變數 y 和乙個或多個自變數 x 之間建立一種關係。多元線性回歸可表示為y...

千萬級資料統計分析

當我們的資料庫中某乙個表的資料量達到了千萬級,同時我們還要依據此表進行資料統計以及分析,這時候麻煩就來了。程式不等待的時間過長,容易造成程式假死的症狀,這樣會給使用者帶來很不好的印象。如何解決這樣的問題呢?我這裡是我的經驗之談,有可能有不正確的地方,請大家指正。1,把統計的時間分散。首先,建立統計表...

資料統計分析常用指標

在進行資料分析時,經常會遇到一些分析指標或術語。這些術語是幫助我們開啟思路,通過多個角度對資料進行深度解讀,可以說是前人已經總結和使用的資料分析方法。下面是資料統計分析常用的指標或術語 1.平均數 一般指算術平均數。算術平均數是指,全部資料累加除以資料個數。它是非常重要的基礎性指標。幾何平均數 適用...