在概率論中,特徵函式的益處體現在:
任意分布與它的特徵函式一一對應;
兩個獨立隨機變數之和的特徵函式就是它們二者特徵函式的積;
特徵函式在零點附近收斂 == 分布函式弱收斂(levi continuous theroem),要處理多個獨立隨機變數之和的分布,可以採取以下方式:
如果隨機變數各階矩都存在,特徵函式在0處求k階導數可得到:
因此,特徵函式是隨機變數的分布的不同表示形式。
對於隨機變數x的分布,用概率密度函式來描述:
對應的概率密度函式如下:
概率密度函式可以直觀描述隨機變數 x 的分布,特徵函式也可以從另乙個角度描述這個分布。
特徵(乙個女博士為例)
以上特徵如果都一樣,那麼:
所有特徵都相等 ==> 上述兩幅影象是同乙個人
根據泰勒級數可知,兩個函式f(x), g(x)的各階導數相等的越多,那麼這兩個函式越相似:
各階倒數都相等 ==> f(x) = g(x)
隨機變數分布的特徵
期望:方差:
偏態:
可見特徵都可由各階矩計算得出,直覺上可以有以下推論(其實還是有條件的,這裡先忽略這些嚴格性,在實際應用中如下思考問題不大):
各階矩相等 ==> 各特徵相等 ==> 分布相同
特徵函式
隨機變數x的特徵函式定義為:
泰勒級數展開:
因此,可得:
原來特徵函式包含了分布函式的所有矩,也就是包含了分布函式的所有特徵。
所以,特徵函式其實是隨機變數x的分布的另外一種描述方式。
特徵函式是共軛傅利葉變換
可見兩者是共軛的關係:
也就是說,特徵函式是f(x)的共軛傅利葉變化,以下將特徵函式當作傅利葉變換來理解。
特徵函式相當於換了乙個座標系
直角座標系下,圓的方程為:
在極座標系下,同樣的圓的方程為:
同乙個數學物件,在不同座標系中,有不同的表達形式:
傅利葉變換和直角座標、極座標的情況類似,相當於換了座標系。
矩形波在時域「座標系」中的形狀:
代數形式如下:
在頻域「座標系」中的影象如下:
代數形式如下:
也是同乙個數學物件,在不同「座標系」中,有不同的表達方式:
所以,特徵函式是把分布函式換了乙個座標系,因此是分布函式的另外一種表現形式:
特徵函式的好處:
正如把直角座標系換到極座標系,可以獲得計算上的便利。
特徵函式把分布函式換到另外乙個座標系,也可以獲得一些計算的好處:
(1)假如不知道分布函式,但是通過實驗計算出了期望、方差、偏度、峰度等特徵,那麼可以用特徵函式去代替分布函式;
(2)兩個分布函式的卷積:
通過特徵函式更換座標系後,可以變為更容易計算的乘法:
通過對 t 求導,可以簡單求出各階矩:
概率論與數理統計 小結7 統計學中的基本概念
注 概率論方面就暫時告一段落,終於可以說說統計方面的事情了。如果說概率論中主要是研究隨機變數的方法學和理論模型,那麼統計學就是利用概率論這一強大的工具來研究具有隨機性的現象 結果的不確定性 而研究這些隨機現象最重要的方法就是,大量重複試驗進而找到其統計規律性。一般步驟為 重複試驗 例如反覆測量,多次...
統計學與深度學習中的基礎概念
統計學習也稱為統計機器學習,是關於計算機基於資料構建概率統計模型並運用資料對模型進行 與分析的一門學科。1特徵 某個物體的屬性,如西瓜的大小,水分,成熟度。2標籤 例如對某個西瓜,是成熟還是不成熟。3樣本 乙個標記好特徵以及標籤的西瓜可以看作是乙個樣本。4資料集 一組樣本構成的集合稱為資料集 dat...
統計學中的第p百分位數的理解
相信大家在做資料分析,需要用到統計學的知識的時候,應該都會遇到第p百分位數百分位數,統計學術語,如果將一組資料從小到大排序,並計算相應的累計百分位,則某一百分位所對應資料的值就稱為這一百分位的百分位數,以pk表示第k百分位數。pk表示至少有k 的資料小於或等於這個數,而同時也有 100 k 的資料大...