次序統計量的概率密度函式
首先給出次序統計量的概念:
設\(x_1,...,x_n\)是從總體中抽樣得到的樣本,將其按從小到大的順序進行排列,得到一組有序的樣本值\(x_,...,x_\),其中\(x_ \leq x_ \leq ... \leq x_\),則\(x_\)為其中單個次序統計量。以下採用兩種方法推導\(x_\)的概率密度函式。
(1)基於分布函式的推導思路
根據分布函式的定義有\(f_}(x)=p(x_ \leq x)\),即次序統計量\(x_\)的分布函式為事件\(x_\)小於等於\(x\)的概率,由於\([x_,...,x_,...,x_]\)是乙個有序樣本序列,因此,下列子事件均能引起事件\(x_ \leq x\)的發生:
有\(k\)個\(x_\)的值不大於\(x\); 有\(k+1\)個\(x_\)的值不大於\(x\);...... 有\(n\)個\(x_\)的值不大於\(x\)
所以:\[\begin
\begin
f_}(x)&=p(x_ \leq x)=\sum_^n不大於x]}=\sum_^n n \\ i \end [f(x)]^i [1-f(x)]^}
\end
\end\tag
\]在上面的表示式中,\(f(x)\)表示總體樣本的分布函式,則次序統計量\(x_\)的概率密度函式可以通過對(1)進行求導得到,在化簡過程中用到了以下等式關係:
\[\sum_^n n \\ i \end p^i (1-p)^}=k \begin n \\ k \end \int_0^p(1-t)^dt}\tag
\]現在來證明(2)式,將等式左右兩邊對\(p\)求導,對右邊求導得到
\[\frac n \\ k \end \int_0^p(1-t)^dt}]}=k \begin n \\ k \end p^(1-p)^\tag
\]對左邊等式求導得到:
\[\begin
\begin
&\frac^n n \\ i \end p^i (1-p)^}]}=\sum_^n n \\ i \end [i p^(1-p)^-(n-i)p^i (1-p)^]}\\
&=k \begin n \\ k \end p^(1-p)^-(n-k)\begin n \\ k \end p^k (1-p)^\\
&+(k+1)\begin n \\ k+1 \end p^k (1-p)^-(n-k-1)\begin n \\ k+1 \endp^(1-p)^+...\\
&=\fracp^(1-p)^p^k (1-p)^}\\
&p^k(1-p)^}-\fracp^(1-p)^+...\\
&=\fracp^(1-p)^=k\begin n \\ k \end p^(1-p)^
\end
\end\tag
\]從(4)可以看出展開式前一項的後半部分和後一項的前半部分可以相消,所以最終僅保留第一項的前半部分和最後一項的後半部分,顯然得到(2)中左右兩個式子對\(p\)的導數是相等的。當然,導數相等並不能證明原函式就是相等的(原函式加減常數的導數仍然保持相等),只需要取乙個\(p\)值代進去看左右兩端是否相等即可。顯然可以證明(2)是成立的。
利用(2)可以得到:
\[f_}(x)=k\begin n \\ k \end \int_0^(1-t)^dt}\tag
\]所以
\[f_}(x)=k\begin n \\ k \end [f(x)]^[1-f(x)]^f(x)\tag
\](2)基於概率密度元的推導方法
在推導之前我們先給出概率密度函式的一種計算方法
\[f(x)=\lim_}=\lim_}\tag
\]由上面的定義可知
\[f_}(x)=\lim_ \leq x+\delta x)}}\tag
\]事件\(x < x_ \leq x+\delta x\),等價於:有\(k-1\)個樣本值小於\(x\),有乙個樣本值在\(x\)和\(x+\delta x\)之間,有\(n-k\)個樣本值大於\(x+\delta x\)。上述三個子事件對應的情況數及概率分別可以表示為:\(\begin n \\ k-1 \end[f(x)]^,\begin n-k+1 \\ 1 \end [f(x+\delta x)-f(x)],\begin n-k \\ n-k \end[1-f(x+\delta x)]^\),所以
\[p(x < x_ \leq x+\delta x)=\begin n \\ k-1 \end \begin n-k+1 \\ 1 \end \begin n-k \\ n-k \end [f(x)]^ [f(x+\delta x)-f(x)][1-f(x+\delta x)]^\tag
\]所以
\[\begin
\begin
f_}(x)&=\begin n \\ k-1 \end \begin n-k+1 \\ 1 \end \begin n-k \\ n-k \end[f(x)]^ \lim_}}\\
&=k\begin n \\ k \end [f(x)]^ [1-f(x)]^ f(x)
\end
\end\tag
\]
Matlab 概率密度函式
以下函式均是對應分布模型的概率密度函式 函式函式功能 y binopdf x,n,p 產生引數為n,p的二項分布,x為取值點,y為對應的值 y poisspdf x,lambda 泊松分布,引數為lambda y geopdf x,p 幾何分布,引數為p y unidpdf x,m 離散型均勻分布,...
均勻分布的概率密度函式 理解概率密度函式
概率密度函式是概率論中的核心概念之一,用於描述連續型隨機變數所服從的概率分布。在機器學習中,我們經常對樣本向量x的概率分布進行建模,往往是連續型隨機變數。很多同學對於概率論中學習的這一抽象概念是模糊的。在今天的文章中,sigai將直觀的解釋概率密度函式的概念,幫你更深刻的理解它。回憶我們在學習概率論...
概率分布函式和概率密度函式
如果隨機變數的值可以都可以逐個列舉出來,則為離散型隨機變數。如果隨機變數x的取值無法逐個列舉則為連續型變數。通俗解釋 能夠用日常使用的量詞度量的取值,如次數,個數,塊數等都是離散型隨機變數。無法用這些量詞度量,且取值可以取到小數點2位,3位甚至無限多位的時候,那麼就是連續型隨機變數 如果微積分是研究...