最近在極客時間學習「程式設計師的數學基礎課」,整理學習筆記如下。
機器學習有不同的演算法,如樸素貝葉斯、決策樹等,每種演算法都會產生不同的效果,如何量化地評價各種演算法的結果?
**極客時間「程式設計師的數學基礎課」
如上圖轉換率在2023年1月12日有乙個突增,假如當天上線了乙個新的演算法a,那轉化率一定是上線的新演算法a造成的嗎?現實結果是不一定,2023年1月12日可能是有乙個**打折活動導致轉化率上公升。假如我們取消1月12日上線的技術方案,轉換率用虛線表示,如下圖所示。
**極客時間「程式設計師的數學基礎課」
所謂a/b測試,就是為同乙個目標設定兩個或多個測試方案,一部分使用者使用測試方案a,另一部分使用測試方案b,最後比較測試方案a的結果和測試方案b的結果,看那兩種測試方案好。
那怎麼評價a、b兩個方案那個更好呢?假如取兩種方案的平均值是否可以呢?
我們先看兩張正態分佈的圖
**極客時間「程式設計師的數學基礎課」
**極客時間「程式設計師的數學基礎課」
由上圖我們可以知道a的平均值u1,b的平均值為u2,u1因此簡單地採用平均值會得出錯誤的結論。
實際實踐中我們會採取統計顯著性檢驗的方式來評價多個方案的結果。為了介紹假設檢驗,先介紹幾個基本的概念。
顯著性差異
由上文中兩個正太分布圖我們可以知道,導致資料差異的兩種原因。
第一種是分布導致的差異,a分布的均值小於b分布,方差相差不大,那麼分布a隨機產生的資料大概率小於分布b隨機產生的資料。
第二種是有取樣誤差導致的差異,也就是說取樣資料無法反映資料的整體分布。上文中取樣的十個資料導致的誤差。
我們把由第一種原因導致的差異稱為「顯著性差異」,第二種原因導致的差異我們稱「無顯著性差異」。
顯著性差異就是研究多組資料間的差異是由資料分布導致的還是取樣導致的。
我們需要區分「差異具有顯著性」和「具有顯著差異」,前者指的是資料分布導致的差異,後者指的是指標意義上相差較大。
統計假設檢驗和顯著性校驗
統計假設檢驗就是事先對隨機變數的引數或整體做出假設,然後利用樣本資訊來判斷假設是否合理。統計學上,這種假設稱為原假設或零假設h0,其對立假設為h1。如果通過樣本資訊判斷出h0不成立,那麼可以推斷出h1成立。
假設檢驗的一般步驟是 先假定原假設成立,然後計算其會導致什麼結果。若在單次實驗中產生了小概率事件,則拒絕原假設,接受其對立假設,如果沒有產生小概率事件,則不能拒絕原假設。
什麼是小概率事件呢?通常把產生概率小於0.05的事件稱為小概率事件,當然根據實際需要這個值也可設定成0.1、0.001。統計學上,我們稱這個概率為α,稱為顯著性水平。
顯著性檢驗是統計假設檢驗的一種,顯著性檢驗可以幫組我們來判斷多組資料之間的差異,是由資料分布導致的「必然」還是取樣導致的「偶然」(必然與偶然與顯著性水平α有關)。顯著性假設檢驗先假設資料分布之間沒有差異,如果樣本發生的概率小於顯著性水平α,則小概率事件發生了,拒絕原假設,也就是認為多組資料之間有分布差異,如果樣本發生的概率大於顯著性水平,則接受原假設,認為多組資料之間沒有分布差異。
p值
已經定義了顯著性檢驗和顯著性水平,那麼如何為多組資料計算他們之間差異的顯著性?我們用p值(p-value)來表示。p是probability的簡稱,即原假設h0為真時,樣本出現的概率。也就是我們觀察到的樣本資料符合原假設h0的概率。
如果p值特別小,則認為樣本值與假設h0的期望有很大偏差,可以拒絕原假設。p值越小,差異越具有顯著性。反之,則接受原假設。
在顯著性檢驗中,原假設是認為多組資料之間無顯著性差異,**於同乙個分布,如果計算的p值很小,則我們有理由拒絕原假設,認為多組資料**於不同的資料分布。實際中,我們計算出p值,然後與顯著性水平α進行比較,從而決定是否接受原假設。
本次我們僅僅介紹了統計假設檢驗的相關概念,下篇我們將介紹具體的統計假設檢驗方法 方差分析(f檢驗)
視覺顯著性
視覺顯著性 visual saliency detection 是指對於真實世界中的場景,人們會自動的識別出感興趣區域 region of interesting 並對感興趣的區域進行處理忽略掉不感興趣的區域。比較典型的視覺顯著性的標註為下圖所示 人體視覺顯著性 人類的視覺注意機制有兩個策略 自底向...
地理建模 顯著性檢驗
學習地理建模時總是遇到顯著性檢驗,這裡記錄一下。顯著性檢驗是用於檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的辦法。顯著性檢驗 的前提條件是 統計假設 用更通俗的話來說就是要先對科研資料做乙個假設,然後用檢驗來檢查假設對不對。一般而言,把要檢驗的假設稱之為原假設,記為h0 把與h0相對...
P值與significant(顯著性)的理解
p值與significant的理解 p值可以理解為結論的風險大小,也就是根據資料得出的結果有多大的錯誤風險,p值越小,結論錯誤的風險越小,即結論越可靠。p值越大,錯誤的風險越大,即結論的可靠性差。實際上significant的含義應該是 非偶然的 當根據樣本資料所得結果是significant,實際...