理論講的再多不會做也白弄
直接上手
一.針對接近正態分佈的(均值,方差,標準差,極差,變異係數,偏度,峰度)
這裡我必須提前說明一點就是,你在寫好函式後,函式的名是dts,你儲存的檔名也必須是dts.m才行,這樣呼叫dts()函式的時候才不會出現錯。
x=[ 1 2 0/0 4 5 6]function dts(x);
a = x(:);
nans = isnan(a);
ind = find (nans); %nan是0/0.
a(ind)=;
xbar= mean(a);
disp(['均值是:',num2str(xbar)]);
s2 = var(a);
disp(['方差是:',num2str(s2)]);
s = std(a);
disp(['標準差是:',num2str(s)]);%資料裡必須是元素的型別一樣,所以要有num2str()函式轉一下。
r = range(a);
disp(['極差是:',num2str(r)]);
cv = 100*s./xbar;%它是乙個相對的數且沒有量綱,所以更具有說明性。
disp(['變異係數是:',num2str(cv)]);
g1 = skewness(a,0);
disp(['偏度:',num2str(g1)]);
g2=kurtosis(a,0);
disp(['峰度',num2str(g2)]);
二.針對 有極端值(中位數,上下四分位數,四分位極差,三均值,上下截斷點)
function fws(x)a = x(:);
a(isnan(a))=;
ss5 = prctile(a,50);
disp(['中位數是:',num2str(ss5)]);
ss25 = prctile(a,25);
disp(['下四分位數是:',num2str(ss25)]);
ss75 = prctile(a,75);
disp(['上四分位數是:',num2str(ss75)]);
rs = ss75-ss25;
disp(['四分位極差:',num2str(rs)]);
sss = 0.25*ss25+0.5*ss50+0.25*ss75;
disp('三均值:',num2str(sss));
三.用樣本的分布描述總體的matlab
莖葉圖:
a=[10 20 10;54 56 78]a=a(:)
b=a-mod(a,10);
b=unique(b);
b=sort(b);
n=length(b);
for k=1:n
tmp=b(k);
tt=sort(a');
tt(tttmp+10)=;
ts=mat2str(mod(tt,10));
ts(ts=='[')=;
ts(ts==']')=;
disp([int2str(tmp),' : ',ts])
end
經驗分布函式圖
x=[12,3,5,6;4,5,6,7];x=x(:)'
x=sort(x)
n=length(x)
m=size(x)%寫這一步是為了比較length 和 size兩個函式的不同
xsui=ones(size(x))
b=cumsum(xsui)
b=b/n
x1=min(x)-(max(x)-min(x))*0.1
xr=max(x)+(max(x)-min(x))*0.1
x=[x1,x,xr]
y=[0,b,1]
h=stairs(x,y)
set(h,'linewidth',2,'color','k')
xlabel('x')
ylabel('f(x)')
grid on
axis([x1,xr,-0.05,1.05])
title('經驗分布函式')
出處:
描述性統計
上一節,我們談了資料視覺化,並且用python 對影象進行了簡單的實現。但是,這僅僅使得我們對資料分布的形狀和特徵有了乙個大概的了解。想要全面了解資料分布的特徵,還需要找到反應資料分布特徵的各個代表值。資料分布的特徵可以從三個方面進行測度和描述 1 分布的集中趨勢,反應各資料向其中心值靠攏或聚集的程...
描述性統計
眾數 一組資料 現最多的變數值 中位數 一組資料排序後處於中間位置上的變數值 分位數 四分位數 十分位數 百分位數 平均數 一組資料相加後除以資料個數的結果值 各變數值倒數的平均倒數,稱為調和平均數 n個變數值乘積的n次方根,稱為幾何平均數 眾數是一組資料分布的峰值,是一種位置代表值,不受值極端的影...
描述性統計
資料分布特徵可以從以下三個方面來描述 資料的水平,反應資料的集中程度 資料的差異,反應資料的離散程度 資料的分布形狀,反應數分布的偏態和峰態。描述資料水平的統計量 平均數 中位數 分位數 眾數。1.1.1 概念 1.1.2 優缺點1.2.1 眾數 1.2.2 中位數 1.2.3 分位數 分位數與中位...