資料自習室 第一周 資料的描述性統計

2021-09-25 11:02:45 字數 1675 閱讀 1948

**眾數:**出現次數最多的數。

**中位數:**按順序排序,處於中間位置的數。

**平均數:**一般指的是 算術平均數。

**極差:**最大值與最小值之間的差距。

**分位數:**亦稱分位點,是指將乙個隨機變數的概率分布範圍分為幾個等份的數值點,常用的有中位數(即二分位數)、四分位數、百分位數等。

1.二分位數

對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的乙個作為中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作為中位數,即二分位數。

2.四分位數

四分位數(quartile)是統計學中分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。

1)第一四分位數(q1),又稱「較小四分位數」,等於該樣本中所有數值由小到大排列後第25%的數字;

2)第二四分位數(q2),又稱「中位數」,等於該樣本中所有數值由小到大排列後第50%的數字;

3)第三四分位數(q3),又稱「較大四分位數」,等於該樣本中所有數值由小到大排列後第75%的數字。

第三四分位數與第一四分位數的差距又稱四分位差

3.百分位數

百分位數,如果將一組資料從小到大排序,並計算相應的累計百分位,則某一百分位所對應資料的值就稱為這一百分位的百分位數。運用在教育統計學中,例如表現測驗成績時,稱pr值。

算術平均數:

算術平均數是指在一組資料中所有資料之和再除以資料的個數。它是反映資料集中趨勢的一項指標。

加權平均數:

加權平均數是不同比重資料的平均數,加權平均數就是把原始資料按照合理的比例來計算,若 n個數中,x1出現f1次,x2出現f2次,…,xk出現fk次,那麼

叫做x1、x2、…、xk的加權平均數。f1、f2、…、fk是x1、x2、…、xk的權。

幾何平均數:

n個觀察值連乘積的n次方根就是幾何平均數。根據資料的條件不同,幾何平均數分為加權和不加權之分。

數值型資料

**方差:**度量隨機變數和其數學期望(即均值)之間的偏離程度。

**標準差:**所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根號,所得之數就是這組資料的標準差。

**極差:**最大值與最小值之間的差距。

**平均差:**指各個變數值同平均數的離差絕對值的算術平均數。

順序資料

**四分位差:**上四分位數(q3,即位於75%)與下四分位數(q1,即位於25%)的差。

分類資料

**異眾比率:**是離中趨勢的指標之一。異眾比率指的是總體中非眾數次數與總體全部次數之比。換句話說,異眾比率指非眾陣列的頻數佔總頻數的比例。

**離散係數:**又稱變異係數,離散係數是測度資料離散程度的相對統計量,主要是用於比較不同樣本資料的離散程度。離散係數大,說明資料的離散程度也大;離散係數小,說明資料的離散程度也小。

**偏態係數:**指非對稱分布的偏斜狀態。換句話說,就是指統計總體當中的變數值分別落在眾數(m0)的左右兩邊,呈非對稱性分布。

**峰態係數:**是對資料分布平峰或尖峰程度的測度。測度峰態的統計量則是峰態係數。

資料結構第一周

若乙個棧的輸入序列為1,2,3,n,輸出序列的第乙個元素是i,則第j個輸出元素是j i 1。2分 f 解析 一串資料依次通過乙個棧,並不能保證出棧資料的次序總是倒置,可以產生多種出棧序列。一串資料通過乙個棧後的次序由每個資料之間的進棧 出棧操作序列決定,只有當所有資料 全部進棧後再全部出棧 才能使資...

實驗室 第一周總結(9 22)

姓 名 於旭庭學 號 52140330102 入 職 時 間 2014.9 本週已完成工作內容及總結 完成 為你自己工作 讀後感 初步了一小部分 課程設計的題目,初來實驗室,剛開始很不適應,感覺到和本科學校的學習方式有很大的不同,這個學校很注重學生動手能力的培養,這正是我所欠缺的能力,實驗室裡高手雲...

MOOC 資料結構 第一周

1 有以下用c c 語言描述的演算法,說明其功能 void fun double y,double x,int n 解 計算x的n次方。2 乙個演算法的空間複雜度是o 1 那麼執行該演算法時不需要任何空間,這個說法正確嗎?為什麼?解 錯誤。若乙個演算法的空間複雜度為o 1 則稱此演算法為原地工作或就...