書的名字**於統計學史上著名事件,也就是假設檢驗的原型:費希爾對一位聲稱自己能夠分清午茶是先加奶還是先加茶。
書的主要內容不是統計學的各種公式,而是各種公式、定理的來由,以及其發現者的故事。
簡單地,做一下今天所看內容的筆記:
卡爾·皮爾遜,19世紀90年代,英國皇家統計協會的成員,在當時的統計學界很有威望,出身居然不是理學,而是政治學 。讀完碩士之後,迷上馬克思,而他後來差不多是傾向共產主義,著作有《科學的語法》(應該是本很有意思的書,拉進書單地幹活)。
而相比較之下,費希爾,出現的比較晚,起碼晚於皮爾遜,這導致了他在當時的一些權威統計學期刊上不得志(也就是不能登自己的文章)。皮爾遜的「專業」、「權威」地位只是一方面原因,我覺得,更多地是,表達能力的問題。費希爾是個超高度近視眼,這使得他少年時期不得深夜讀書,於是數學老師基本只能把數學書唱給他聽。。而這恰恰培養了他的邏輯、幾何抽象能力,之後費希爾在幾何方面牛刀小試,而後做數學研究,可謂是高產。不過,可悲地是,無人欣賞--因為看不懂,這還真是腦子太先進的弊端:配不上周圍豬一樣的隊友。他的思考能力強 表達能力弱 不僅體現在這些高深的科研之上,還有他後來的教學生涯:他常常會被學生不明白一些很簡單的 他自己說的 ,應該沒別的人這麼想 東西而氣得不輕……(估計,做他的學生也是件苦力活。。)再說,費希爾的其他方面,學霸級的人物,劍橋高材生,與之相連的,還有法西斯主義,也許有點妄言,但起碼有類似的傾向:參與優生學(大概就是資助窮人的話,會助力他們繁衍後代和中產階級的後代爭奪資源,這樣代復一代之後,「壞基因」越來越多,而「好基因」漸漸消亡)……這麼聰明的腦子,怎麼就這麼想不開呢。。寫點統計學相關的東西吧,給大牛皮爾遜,皮爾遜看不懂,轉身給了大牛戈塞特,戈塞特也看不懂,於是只能投稿在一些不怎麼出名的農學、生物學雜誌上,有些居然還是費希爾本人自掏腰包才肯刊登,簡直暴殄天物。後來,一位瑞典數學家 克拉默 發現了費希爾的研究作品(主要是二戰期間,國國(除了瑞典吧)都忙著打仗,這位瑞典人與國際科學界失聯 沒人玩了),開始研究費希爾研究的東西,發現有些正是當時科研人所作的。所謂,寫《紅樓夢》是乙個工程,寫完之後讀《紅樓夢》又是另外乙個工程。沒得辦法,誰讓克拉默不早點遇見費希爾,這樣就可以像霍金那樣 活著的時候就能做科學界的巨人…
卡爾·皮爾遜和費希爾二位大牛老是鬧不和,不過,科研人怎麼能夠張口就罵人呢?於是二人一致採取在自己的刊登文章中指出對方的錯誤的手段,宣洩不滿 共話統計學的發展 。這麼下去,倒也不會引發戰爭,但是,矛盾還是需要調解員的,這個調解員就是大牛戈塞特。
在吉尼斯釀酒公司工作時,戈塞特思考如何優化釀酒所需的酵母菌數量,發現了酵母菌的繁殖符合泊松分布。值得注意的是,泊松分布並不是第一次出現在人們面前,只是大家不太能找到什麼事件是符合泊松分布的。不過,這家公司禁止員工發表**,擔心會洩露公司的經營秘密。於是,戈塞特只好給自己取個筆名「學生」,發表在《生物統計》上。
《生物統計》是高爾頓、皮爾遜、韋爾登三人創辦的乙個期刊,令我驚訝的是,統計之初不是為商業,而是為生物。高爾頓原本計畫研究人類智力的發展,奈何沒有評價智力的指標,就把目標轉向了人類身高上,也就是著名的父子身高的平均回歸。皮爾遜他們建立該期刊,是為了給同胞達爾文的進化學說提供理論支援。後來,高爾頓和韋爾登接連辭世,《生物統計》自然就是皮爾遜的囊中之物了。
戈塞特的t檢驗,明顯特徵是小樣本。塞戈特經常自己動手計算統計量,不覺地想到我考統計課程的時候,拿著計算器,算幾遍都算不對的囧 つ﹏⊂ ,深諳這當中的不容易啊,雖然是小樣本(粗略說,大概是30個樣本觀測值以下)。
皮爾遜提出偏斜分布的概念,偏斜分布由四個數值確定,分別是均值(觀測值分布的中間值)、標準差(大多數觀測值相對於均值的分散程度)、對稱度(觀測值偏向均值一邊的程度,我覺得,大概就是教材上的偏度吧)、峰度(罕見觀測值相對均值的分散程度)。這一思想的提出,將過去科學以確切的實物為研究物件,轉變成描述觀測的事物隨機性的數學函式。果然,就像馬爺爺說的那樣,人類對事物本質的認識是呈螺旋式上公升的。
南丁格爾,一位女統計學工作者(這是在這本書中不多出現的),稱自己是小人物,對著皮爾遜、費希爾、戈塞特等等這些大牛,稱自己是小人物或許也是一件很驕傲的事吧??
內曼,年少時深深崇拜著勒貝格(就是發明勒貝格積分的那位),有朝一日終於遇見了勒貝格,卻被其冷冷對待甚至可以說是無禮,於是之後內曼先生的教人寫書活動中處處充滿著友好、和藹的意味,這麼想勒貝格也是教會了內曼點什麼……只是方式不太恰當。
柯爾莫哥洛夫,聽名字這麼長就知道是位**數學家,再看結尾是-夫-就知道是位男數學家。在印象中,他大概是這本書裡出現的繼費希爾之後的第二位數學天才。其貢獻在於奠定了概率論的理論基礎,並給出合理的解釋,這麼說似乎是很籠統……反正是個很偉大的人。
列昂惕夫提出投入-產出模型,將矩陣引入實際問題的解決中,奈何矩陣逆的計算是項「錘煉靈魂的儀式」(書裡的原話),好在和佛的計算機出現了,不過,那群會計謹遵上級指示,不肯給服務型消費報賬(比如花錢讓哈佛的計算機給矩陣求逆這種服務是不能報賬的),再三協商之下,開出一張「像哈佛購買乙個逆矩陣」的單子才得以完成報賬。(這裡也有個名人似乎是漢森,就是抽樣調查 書裡的那位)
圖基,這位美國大佬,似乎距離現在並不很遠,但是他的發明卻出現在各個行業、領域,比如******記不清了***後面再補
施蒂格勒誤稱定律:大概意思是一般地,乙個定律如果選乙個科學家的名字命名,那麼這個定律很有可能並不是這個科學家所發現的。比如,高斯分布、泊松分布,洛必達法則貌似也是
未完待續……
《女士品茶》讀書筆記
書的名字 於統計學史上著名事件,也就是假設檢驗的原型 費希爾對一位聲稱自己能夠分清午茶是先加奶還是先加茶。書的主要內容不是統計學的各種公式,而是各種公式 定理的來由,以及其發現者的故事。簡單地,做一下今天所看內容的筆記 卡爾 皮爾遜,19世紀90年代,英國皇家統計協會的成員,在當時的統計學界很有威望...
女士品茶 簡單摘錄
費歇爾 實驗設計的第一步是建立一組數學公式,用以描述待蒐集資料與欲估計結果之間的關係,因此,任何有用的實驗必須是能夠提供估計結果的。費歇爾 人們不可避免地會發現以前所得出的觀點,至少在一定程度上,明顯是過時的或者錯誤的。費歇爾 真實分布只是乙個抽象的數學公式,蒐集的資料只能用來估計這個真實分布的引數...
mysql運維 讀書筆記 Mysql 讀書筆記
mysql儲存時間有兩種型別 datetime和timestamp。分別說一下兩者的區別。datetime,以8位元組儲存時間,理論上可以從0000年儲存到9999年。並且沒有時區的概念,它儲存的就是乙個時間點的概念。timestamp和datetime最主要的不同就是,它是以4個位元組儲存,由19...