乙個統計指標,許多科學領域中的研究結果的意義均是由p值來判斷的。它們被用來證明或駁回乙個「零假設」:通常假定所測試的效果並不存在。
當p值越小,該實驗結果是由純粹的偶然所造成的可能性就越小。
由於樣本採集的有限性,他通常只能以小樣本數來進行統計平均,不過在這研究的過程中,他發現小樣本統計平均結果不滿足他一開始認為的高斯分布。為了明白平均數精度與樣本數的關係,gosset嘗試著去計算不同樣本尺寸下的平均數精度,而這一問題也正是**的研究核心。
他計算得到的結果包含在了他的t-table分布表中,而現在一般只要是接觸過統計課程的人都會知道t分布,即用來描述不同樣本數對於統計概率的影響,當樣本數足夠大的時候,就等同於標準正態分佈(高斯分布)。
fisher帶著一些武斷性的選擇α=0.05的概率值來衡量是否具有統計顯著性,當 p值(統計學術語,原假設成立時得到與樣本相同或者更極端結果的概率,p值越小,拒絕原假設的理由越充分,表明結果越顯著)小於0.05時,我們拒絕原假設。
比如,一位研究人員想要確定一種新的教學方法是否有效,他可以選取一組新教學方案教學的學生和普通教學方案的學生的學習成績做對比。如果接受新方法的學生的分數比那些沒有接受新方法的學生的分數高出5%的機率(p值),那麼fisher就認為新教學方案是有效的。不過後來證明fisher武斷的選擇α=0.05的概率值來衡量是否具有統計意義的邏輯是有缺陷的。
乙個多世紀後,許多研究者認為fisher選擇α=0.05誘發了乙個科學上的危機。諸如心理學、經濟學和醫學等學科上的實驗結果,如果使用α=0.05作為判定閾值的話,那麼將導致實驗結論錯誤。
使用α=0.005來作為新的閾值。
enjamin說:「雖然這樣直接使用α=0.005解決方案並不完美,但已經可以在短期內做很多事。」正如提案的研究所表明的,使用α=0.005解決方案可以減少一半的經濟學和心理學實驗上的錯誤結果。
benjamin承認選擇α=0.005也帶有一點武斷性質,併同他的同事也討論過其他更低的閾值,但是他認為α=0.005是符合邏輯的。benjamin補充到,對於0.05閾值的共同解釋——結果(原假設)有95%的可能性是正確的,但使用更先進的統計技術發現,這95%的機率實際上是更接近於p值等於0.005。
閾值從0.05更改到0.005只能挽救醫學,心理學和經濟學領域部分的研究結果,benjamin的團隊更希望醫學研究人員、經濟學家和心理學家能去正視現今他們領域中出現的科研誠信危機。
機器學習基礎 math(5) 矩陣
主成分分析 pca 的時候,會需要矩陣的跡。對上面的線性方程組,第乙個方程和第二個方程有不同的解,而第2個方程和第3個方程的解完全相同。從這個意義上說,第3個方程是 多餘 的,因為它沒有帶來任何的資訊量,把它去掉,所得的方程組與原來的方程組同解。為了從方程組中去掉多餘的方程,自然就匯出了 矩陣的秩 ...
機器學習基礎 math(16) 各種乘積
按元素乘法有時候被稱為hadamard 乘積,或者schur 乘積 訊號與系統等學科中的 卷積操作的本質,神經網路中的卷積就是乘累加 訊號處理中的卷積就是加權疊加。具體點,平移 無反褶 疊加。可以看到卷積的重要的物理意義是 乙個函式 如 單位響應 在另乙個函式 如 輸入訊號 上的加權疊加。樓主這種做...
機器學習基礎 math(17) 各種距離
任意滿足測度的 4 個條件的函式都可以被定義為距離。non negativity or separation axiom 非負性或分離公理 identity of indiscernibles 不可分辨的同一性 symmetry 對稱性 subadditivity or inequality 次可加...