機器學習 樸素貝葉斯 例子

2021-08-19 19:35:18 字數 2389 閱讀 8078

一、學習樸素貝葉斯之前先了解一下 條件概率下 貝葉斯公式

1、舉例是兩個工具機m1和m2 用例生產扳手機器

生產扳手(個數 )

mach1

30mach2

20不合格佔1%(defective)機器

次品分布比例()

mach1

50%mach2

50%2、問題:mach2生產的不合格產品的概率是多少?

p(mach1)=30/50 = 0.6

p(mach2)=20/50 = 0.4

p(defect)=1%

p(mach1|defect)= 50%

p(mach2|defect)= 50%

p(defect|mach2)= ?

根據條件概率 貝葉斯法則

p(a|b) : 在事件b發生的條件下a發生的概率

p(b|a) : 在事件a發生的條件下b發生的概率

p(a) :a 單獨發生的概率

p(b) :b 單獨發生的概率單獨發生的概率

p(defect|mach2)= (p(mach2|defect)* p(defect))/ p(mach2)

= (0.5*0.1)/0.4 = 0.125

二、樸素貝葉斯

1.根據薪資和年齡的對30個人進行了分類(打標籤)

2.假設分類標籤為上班的交通方式:步行(walks)、開車(drives),那新加入乙個員工(new data point)是什麼是屬於那個類或者那種方式上班?

3、利用貝葉斯法則(公式)

4、p(walks)=10/30 (已知的先驗概率

5、p(x)=4/30 (在步行的情況下觀測到x的概率(下圖畫乙個圈,覆蓋乙個範圍,有4個人,這個範圍裡面有開車和有步行,步行的有3個,開車的1個,這個半徑大小和調優有關係,現在不考慮大小

6、p(x|walks)=3/10 (x在步行人中的概率,walks=10

7、代入公式求值:這個人步行的概率是0.75

8、問題(作業),這個人開車概率是多少?

p(drives)=20/30 (已知的先驗概率

p(x)=4/30

p(x|drives)=1/20

p(drives|x) =( p(x|drives)* p(drives))/p(x) = ( 1/20 *20/30 )/(4/30) = 0.25

機器學習 樸素貝葉斯

樸素貝葉斯原理 1.貝葉斯公式 2.樸素貝葉斯的模型 3.後驗概率最大化的含義 4.樸素貝葉斯的引數估計 4.1.特徵是離散值 假設符合多項式分布 4.2.特徵是稀疏的離散值 假設符合伯努利分布 4.3.特徵是連續值 假設符合正態分佈 5.樸素貝葉斯演算法過程 6.樸素貝葉斯演算法小結 scikit...

機器學習之樸素貝葉斯

寫在前面 本文寫自初學時,若後續學習過程中有新的理解,將不定期進行更新 若文中敘述有誤,望不吝賜教,也將及時修改 貝葉斯分類是一類分類演算法的總稱,這類演算法均以貝葉斯定理為基礎,故統稱為貝葉斯分類。而樸素樸素貝葉斯分類是貝葉斯分類中最簡單,也是常見的一種分類方法。在理解樸素貝葉斯之前,需要對兩個數...

樸素貝葉斯 機器學習實戰

主要引用的是機器學習實戰中第四章的例子。該例子中將所有的詞當作乙個特徵。我們已知類別下相應特徵的概率,計算出乙個特徵下屬於不同類別的概率大小,然後選取較大的為此特徵的類別。import numpy as np def loaddataset postinglist my dog has flea p...