統計描述量

2021-07-16 06:42:40 字數 911 閱讀 8327

資料分析的任務是對樣本資料進行分析,提取資料中包含的有用資訊。資料的資訊借助資料的主要特徵展示出來,這些特徵包括資料的集中位置,分散程度和資料分布等。

描述資料特徵的基本統計量有均值、順序統計量、中位數和百分位數。

均值

均值 (mean) 是資料的平均數, 描述資料取值的平均位置。x⎯

⎯=1n

∑i=1

nxi

r 計算樣本均值

mean(x, trim = 0, na.rm = false)

順序統計量

排列順序統計量 (order statistic) 指 n 個資料按從小到大的順序。x1

≤x2≤

⋯≤xn

r 資料排序, 返回排序後的資料

sort(x, decreasing = false)

r 資料排序,返回排序後的下標

order(x)

中位數

中位數 (median) 指資料排序位於中間位置的值. 中位數描述描述資料中心位置的數字特徵: 對稱分布的資料, 均值與中位數比較接近,且中位數不受異常值的影響。me

=使用

> source("data_outline.r")

> w<-c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5, 66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)

> data_outline(w)

[1] 薛毅, 陳立萍. 統計建模與r軟體[m]. 清華大學出版社, 2007: 107-115.

統計描述分析

proc means data 資料集 class 分組變數,按變數名列分組統計,不要求排序 var 要分析的變數名 by 分組變數,按變數名列分組統計,必須排序 freq 分析變數的品書 weight 權重 id 輸出時加上的索引 output out 資料集名 關鍵字 新變數名 proc uni...

統計併發量

需求 需要統計 的併發量,並繪圖。只需要寫出shell指令碼即可,不用關心zabbix配置。假設日誌路徑 data logs www.aaa.com access.log 日誌格式如下 112.107.15.12 07 nov 2018 09 59 01 0800 www.aaa.com api l...

描述性統計

上一節,我們談了資料視覺化,並且用python 對影象進行了簡單的實現。但是,這僅僅使得我們對資料分布的形狀和特徵有了乙個大概的了解。想要全面了解資料分布的特徵,還需要找到反應資料分布特徵的各個代表值。資料分布的特徵可以從三個方面進行測度和描述 1 分布的集中趨勢,反應各資料向其中心值靠攏或聚集的程...