方差(variance): 變數與其均值的差的平方和除以(變數數+1)。
如有一組資料: [1,2,3,4,5], 其均值就是 (1+2+3+4+5) / 5 = 3
所以其方差為: ((1-3)^2 + (2-3)^2 +(3-3)^2 + (4-3)^2 + (5-3)^2) /( 5+1) = 1.6666....
標準差(standard deviation):方差的算術平方根
方差和標準差反應了一組資料的離散程度:
當方差越小時,資料的離散程度越小
而當方差越大時,資料的離散程度也就越大。
如有兩組資料
a = [1,2,3,4,5]
b=[1,5,7,9,11]
a 的方差為2 、b的方差為11.84 ,從方差的大小比較,var(a)所以b的離散程度比a的離散程度高
為什麼方差可以體現資料的離散程度?
由公式可知:
當所有的變數值都一樣時,均值等於變數值
所以方差為0,此時離散程度為0。當各個變數值裡均值都有一定距離時
方差大於0。
例子:通過使用 from sklearn.datasets.samples_generator import make_blobs 圍繞3個中心點來生成資料集
紅色的點代表 中心點
藍色的點代表 生成點
通過修改make_blobs裡面的cluster_std引數來控制 生成點 與 中心點之間的離散程度。而cluster_std引數
對應就是標準差
(1)當標準差為 0.60時:
(2) 當標準差為 0.3時
影象反映了不同標準差之間資料發布的情況
由此也反映了標準差與數值離散程度之間的對應關係。
資料離散程度的指標 標準差
標準差 standard deviation 標準差,在概率統計中最常使用作為統計分布程度 statisticaldispersion 上的測量。反應組內個體間的離散程度。標準差的計算 calculation of standard deviation 標準差的計算公式為 1 n i 1n x i ...
方差 標準差 協方差理解與區別
1 方差 用來度量隨機變數和其數學期望 即均值 之間的偏離程度。計算 各個資料與平均數之差的平方的平均數 2 標準差 能反映乙個資料集的離散程度。計算 方差開根號 3 協方差 用於衡量兩個變數的總體誤差。而方差是協方差的一種特殊情況,即當兩個變數是相同的情況。變化分析 1 如果兩個變數的變化趨勢一致...
方差公式初三 九年級數學方差與標準差
學習目標 了解方差的定義和計算公式。2.理解方差概念的產生和形成的過程。3.會用方差計算公式來比較兩組資料的波動大小。4.經歷探索極差 方差的應用過程,體會資料波動中的極差 方差的求法時以及區別,積累統計 經驗。學習重點 掌握方差與標準差的概念及計算公式,會用方差計算公式來比較兩組資料的波動大小。學...