自然語言處理(十一) 產生式模型和判別式模型

2021-10-01 22:35:01 字數 572 閱讀 1733

產生式模型和判別式模型的區別,下面會用乙個天氣判斷的案例來解釋。首先我們需要了解一下什麼是分類器,用數學的符號來描述分類器就是:輸入x以及分類變數y,求p(y | x)。例如,x是雲量、氣溫、濕度。y是天氣狀況(下雨?不下雨?)。分類器的作用就是分析雲量等這些指標,來得出下雨或者不下雨的概率。

到底怎麼計算下雨的概率,產生式模型和判別式模型有不同的計算思想。產生式模型首先是先估算聯合概率密度p(x,y),再通過貝葉斯公式求出p(y | x)。而判別式模型直接估算p(y | x)。產生式模型的典型代表是樸素貝葉斯,判別式模型的典型代表說邏輯回歸。

接下來就用天氣判斷來執行一下樸素貝葉斯的思想流程。

p(y = 「rain」 | x) =

p(y = 「sunny」 | x) =

如果上述兩個式子想比。就得到

這樣一來,p(x)就約去了,只要這個比值大於1,那麼就認為要下雨,如果比值小於1,那麼就晴朗。不過

貝葉斯公式

那麼問題又來了

同理判別式模型不會計算這麼繁雜的中間過程,而是直接計算

最後本文如果有什麼錯誤的內容,望各位同行不吝賜教,拜謝。

自然語言處理 資訊模型

今天拜讀了數學之美的第一章,例舉的例子感覺真是淺顯易懂,這裡不禁要對吳軍老師的寫作功底拜服,下面談談對資訊模型的理解,數字 文字和語言作為資訊的載體,他們的目的都是記錄和傳播資訊,就像我們的老祖先一樣烏拉烏拉幾句,對方就明白了,你丫的罵我,拿起石頭就扔過去了,其實他們的這種交流可以概括為 資訊1 編...

自然語言處理 序列模型

本文主要寫些關於常見序列模型的一些理解,主要是為了記錄一下,自己對這幾個模型的理解還遠遠不夠。馬爾可夫性是指當前狀態t 只和前一狀態t 1相關 一階 和之前t 2之前的就不相關,這個也算是n gram語言模型吧,都是為了控制模型複雜度 一方面模型過於複雜,資料集不夠會導致模型達不到收斂 另外一方面模...

自然語言處理(N gram語言模型)

n gram語言模型 問題描述 由於公司業務產品中,需要使用者自己填寫公司名稱,而這個公司名稱存在大量的亂填現象,因此需要對其做一些歸一化的問題。在這基礎上,能延伸出乙個 使用者填寫的公司名是否有效的模型出來。目標 問題提出來了,就是想找到一種辦法來 使用者填寫的公司名是否有效?問題分析 要想 使用...