拉普拉斯修正學習筆記

2021-09-29 16:56:56 字數 1299 閱讀 7930

為什麼要做平滑處理?

由於在計算例項的概率時,如果某個量x,在觀察樣本庫(訓練集)中沒有出現過,會導致整個例項的概率結果是0。

如,在文字分類的問題中,當乙個詞語沒有在訓練樣本**現,該詞語屬於各類的概率為0,使用連乘計算文字出現在各類的概率也均為0。這是不合理的,不能因為乙個事件沒有觀察到就認定該事件被分類的概率是0。

為了解決零概率的問題,法國數學家拉普拉斯最早提出用加1的方法估計沒有出現過的現象的概率,所以加法平滑也叫做拉普拉斯平滑。

假定訓練樣本很大時,每個分量x的計數加1造成的估計概率變化可以忽略不計,但可以方便有效的避免零概率問題。

舉例如下

假設在文字分類中,有3個類,c1、c2、c3,在指定的訓練樣本中,某個詞語k1,在各個類中觀測計數分別為0,990,10,k1的概率為0,0.99,0.01,對這三個量使用拉普拉斯平滑的計算方法如下:

1/1003 = 0.001,991/1003=0.988,11/1003=0.011

在實際的使用中也經常使用加 λ

\lambda

λ(1≥λ

\lambda

λ≥0)來代替簡單加1。如果對n個計數都加上λ

\lambda

λ,這時分母也要記得加上n*λ

\lambda

λ。

個人理解:有的時候樣本量巨大,如1*e15個,此時單純的加1在精度不夠的時候可能導致下溢,仍會造成0概率問題。或者是連乘多項導致下溢等。

含義拉普拉斯修正的含義是,

在訓練集中總共的分類數,用 n 表示;x

ix_i

xi​ 屬性可能的取值數用 n

in_i

ni​ 表示,因此原來的先驗概率 p( c )的計算公式由:

被拉普拉斯修正為:(n為總分類數)

類的條件概率p(x | c) 的計算公式由:

被拉普拉斯修正為:(di 屬性可能的取值數用 ni 表示)

拉普拉斯運算元 拉普拉斯方程之美

物理學有它自己的羅塞塔石碑。它們是連線宇宙間看上去不同的領域的天書,它們將任何物理學分支同純粹數學聯絡起來。拉普拉斯方程就是其中之一 它幾乎無處不在 在電磁學 在流體力學 在引力 在熱學 在肥皂泡 拉普拉斯方程是以法國數學家pierre simon laplace 皮埃爾 西蒙 拉普拉斯 的名字命名...

拉普拉斯銳化

影象銳化 提供影象的對比度從而使得影象清晰起來,在影象平滑中,為了使得影象模糊,通常採用鄰域平均的方法縮小鄰域內畫素之間的灰度差異。在影象銳化中,提高鄰域內畫素的灰度差來提高影象的對比度。影象的拉普拉斯銳化是利用拉普拉斯運算元對影象進行邊緣增強的一種方法,拉普拉斯運算元是以影象鄰域內畫素灰度查分計算...

拉普拉斯變換

void cvlaplace const cvarr src,cvarr det int aperturesize 3 該函式通常把原影象和目標影象以及中孔大小作為變數。原影象可以是8位 無符號 影象,也可以是32位 浮點 影象。而目標影象必須是16位 有符號 或者32位 浮點 影象。這裡的中孔與s...