002 描述統計學基礎

2021-09-03 03:08:49 字數 1038 閱讀 6781

這一節課很簡單,就是我們在中學中學習的均值,中位數,眾數,這些概念主要是在上一節課中學到的數值資料這一分類中進行的。

下面把這些概念讓我們再回顧一遍吧!

分析數值資料

數值資料的四個方面

分析數值資料有四個主要方面

集中趨勢測量

集中趨勢測量的方式有三種:

center 集中趨勢測量:

均值

均值在數學中通常稱為平均數或預期值。我們通過將所有值相加,然後除以資料集中所有測量值的個數來計算均值。如 1,4,6,7,2的均值為 4 .

中位數

中位數將我們的資料分為兩部分,一半低於它,一半高於它。如何計算中位數取決於我們有偶數個還是奇數個觀察值。

奇數個值的中位數

如果我們有奇數個觀察值,中位數直接是中間的那個數字。例如,如果我們有 7 個觀察值並按從小到大排列,則中位數是第四個值。如果我們有 9 個觀察值,則中位數是第五個值。

偶數個值的中位數

如果我們有偶數個觀察值,中位數是中間兩個值的平均值。例如,如果我們有 8 個觀察值並從小到大排列,則計算第四和第五個值的平均值。

要計算中位數,我們必須首先對值排序。

我們使用平均數還是中位數來描述資料集,很大程度上取決於我們資料集的 形狀 以及是否有任何 異常值 。

眾數

眾數指一組資料中出現次數最多的資料值。

乙個資料集中可能有多個眾數,也可能沒有眾數。

無眾數如果資料集中的所有值出現的頻數相同,則不存在眾數。如果我們有一組資料集:

1, 1, 2, 2, 3, 3, 4, 4

則沒有眾數,因為所有觀察值發生的次數相同。

多個眾數

如果兩個(或多個)數字出現的次數都是最多的,則有多個眾數。如果我們有一組資料集:

1, 2, 3, 3, 3, 4, 5, 6, 6, 6, 7, 8, 9

其中有兩個眾數 3 和 6,因為這兩個值都出現了三次,出現頻率最高,而其他的值都只出現了一次。

教你如何區分描述統計學與推斷統計學

統計學被廣泛的應用於各個領域之上,從物理和社會科學,再到人文科學,甚至被用在工商業及zf的情報決策當中。統計學又可分為描述統計學和推斷統計學,那麼要怎樣來區分她們呢?我們先來了解描述統計學和推斷統計學的概念 因此我們可以得出兩者的共同點 兩者都以概率論為理論基礎,都是數理統計學,都是應用數學的乙個分...

統計學 統計學基礎

五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...

描述性統計學

描述性統計學是資料分析的基礎內容,雖是基礎,但是不能忽視,資料中最初展示的資訊往往就是利用描述性統計學總結出來的。描述性統計學回顧 描述性統計學有五個重要的指標 1,平均值 2,四分位數 3,標準差 4,變異係數 5,標準分 1,平均值 平均值的統計學意義很簡單,就是求一組資料的平均數 雖然平均數簡...