正態分佈的前世今生

2021-09-17 00:04:56 字數 2303 閱讀 7102

*神說,要有正態分佈,就有了正態分佈。

神看正態分佈是好的,就讓隨機誤差就服從了正態分佈。

創世紀-數理統計*

學過基礎統計學的同學大都對正態分佈非常熟悉。這個鐘型的分布曲線不但形狀優雅,其密度函式寫成數學表示式 f(

x)=1

2π−−√σe−

(x−μ

)22σ

2f(x)=12πσe−(x−μ)22σ2

都出現在了公式之中。在我個人的審美之中,它也屬於 top-n 的最美麗的數學公式之一,如果有人問我數理統計領域哪個公式最能讓人感覺到上帝的存在,那我一定投正態分佈的票。因為這個分布戴著神秘的面紗,在自然界中無處不在,讓你在紛繁蕪雜的資料背後看到隱隱的秩序。

正態分佈又通常被稱為高斯分布,在科學領域,冠名權那是乙個很高

的榮譽。去過德國的兄弟們還會發現,德國的鋼鏰和10馬克的紙幣上都留有高斯的頭像和正態密度曲線。正態分佈被冠名高斯分布,我們也容易認為是高斯發現了正態分佈,其實不然,不過高斯對於正態分佈的歷史地位的確立是起到了決定性的作用。

正態曲線雖然看上去很美,卻不是一拍腦袋就能想到的。我在本科學習數理統計的時候,課本一上來介紹正態分佈就給出密度分布函式,卻從來不說明這個分布函式是通過什麼原理推導出來的。所以我一直搞不明白數學家當年是怎麼找到這個概率分布曲線的,又是怎麼發現誤差服從這個奇妙的分布的。直到我讀研究生的時候我的導師給我介紹了陳希儒院士的《數理統計簡史》這本書,看了之後才了解了正態分佈曲線從發現到被人們重視進而廣泛應用,也是經過了幾百年的歷史。

正態分佈的這段歷史是很精彩的,我們通過講幾個故事來揭開她的神秘面紗。

第乙個故事和概率論的發展密切相關,主角是棣莫弗(de moivre)和拉普拉斯(laplace)。拉普拉斯是個大科學家,被稱為法國的牛頓;棣莫弗名氣可能不算很大,不過大家應該都熟悉這個名字,因為我們在高中數學學複數的時候我們都學過棣莫弗定理

(cosθ+

isinθ)

n=cos(nθ

)+isin(n

θ)(cos⁡θ+isin⁡θ)n=cos⁡(nθ)+isin⁡(nθ)

趨於無窮的時候,其極限分布都有正態的形式,這構成了數理統計學中大樣本理論的基礎。

棣莫弗在二項分布的計算中瞥見了正態曲線的模樣,不過他並沒有能展現這個曲線的美妙之處。棣莫弗的這個工作當時並沒有引起人們足夠的重視,原因在於棣莫弗不是個統計學家,從未從統計學的角度去考慮其工作的意義。正態分佈(當時也沒有被命名為正態分佈)在當時也只是以極限分布的形式出現,並沒有在統計學,尤其是誤差分析中發揮作用。這也就是正態分佈最終沒有被冠名棣莫弗分布的重要原因。那高斯做了啥了不起的工作導致統計學家把正態分佈的這頂桂冠戴在了他的頭上呢?這先得從最小二乘法的發展說起。

第二個故事的主角是尤拉(euler),拉普拉斯(lapalace),勒讓德(legendre)和高斯(gauss),故事發生的時間是十八世紀中到十九世紀初。十

七、十八世紀是科學發展的**年代,微積分的發展和牛頓萬有引力定律的建立,直接的推動了天文學和測地學的迅猛發展。當時的大科學家們都在考慮許多天文學上的問題。幾個典型的問題如下:

這些天文學和測地學的問題,無不涉及到資料的多次測量、分析與計算;十

七、十八世紀的天文觀測,也積累了大量的資料需要進行分析和計算。很多年以前,學者們就已經經驗性的認為,對於有誤差的測量資料,多次測量取平均是比較好的處理方法。雖然缺乏理論上的論證,也不斷的受到一些人的質疑,取平均作為一種異常直觀的方式,已經被使用了千百年,在多年積累的資料的處理經驗中也得到相當程度的驗證,被認為是一種良好的資料處理方法。

以上涉及的問題,我們直接關心的目標量往往無法直接觀測,但是一些相關的量是可以觀測到的,而通過建立數學模型,最終可以解出我們關心的量。這些問題都可以用如下數學模型描述:我們想估計的量是β0

,…,β

pβ0,…,βp

勒讓德在**中對最小二乘法的優良性做了幾點說明:

*神說,要有正態分佈,就有了正態分佈。

神看正態分佈是好的,就讓隨機誤差就服從了正態分佈。

創世紀-數理統計*

正態分佈的前世今生之二

三 最小二乘法,資料分析的瑞士軍刀 第二個故事的主角是尤拉 euler 拉普拉斯 lapalace 勒讓德legendre 和高斯 gauss 故事發生的時間是十八世紀中到十九世紀初。十 七 十八世紀是科學發展的 年代,微積分的發展和牛頓萬有引力定律的建立,直接的推動了天文學和測地學的迅猛發展。當時...

高斯 到 正態分佈 的前世今生

學過基礎統計學的同學大都對正態分佈非常熟悉。這個鐘型的分布曲線不但形狀優雅,其密度函式寫成數學表示式 也非常具有數學的美感。其標準化後的概率密度函式 更加的簡潔漂亮,兩個最重要的數學常量 e都出現在了公式之中。在我個人的審美之中,它也屬於top n的最美麗的數學公式之一,如果有人問我數理統計領域哪個...

高斯 到 正態分佈 的前世今生

學過基礎統計學的同學大都對正態分佈非常熟悉。這個鐘型的分布曲線不但形狀優雅,其密度函式寫成數學表示式 也非常具有數學的美感。其標準化後的概率密度函式 更加的簡潔漂亮,兩個最重要的數學常量 e e e都出現在了公式之中。在我個人的審美之中,它也屬於top n的最美麗的數學公式之一,如果有人問我數理統計...