貝葉斯分類
有意義區分和無意義區分
既然要區分兩種點那麼兩種點必然有區別,當區分有區別的點時說是有意義區分。而完全區分那種一模一樣的點則是無意義區分。所以我們所討論的都是有意義的區分。
完全區分和不完全區分
貝葉斯分類器是一種概率上的區分,而假如兩種點一種是黑的一種是白的那不需要用貝葉斯分類器區分,因為一種點屬於白的概率是百分之百。所以稱這種分類為完全區分。
另一種就是給定乙個點一些屬性,假設目前只有兩種分類,那麼它屬於哪種點是乙個概率問題,不是百分之百屬於哪乙個,此時就稱為不完全區分,用貝葉斯分類器來分類。
或者是給定的資訊是不完整的,比如給你一張臉沒有頭髮讓你判斷性別,有的臉你還真的不保準判讀對,此時就用貝葉斯分類。
分類思路:
以分類男女為例子,現在我們以胸的大小、頭髮長短、體重輕重來計算此人是男人還是女人的概率。當然其實我們心裡都明白,哪些屬性對人的類別有什麼影響,比如頭髮長的話是女人的概率肯定是大的。但是假設我們不知道這些東西,那麼如何來做?
當然假如給我們一些訓練資料,給我了50個男和50個女和對應的屬性。我通過這些資料得到的比例,比如頭髮長是女人的概率是百分之80,這個80%只是100個人得到的資料,但是我假設他是世界上所有人概率。
於是我得到三個資訊,是女人頭髮長、胸大、體重的概率。
接下來我從100個人以外隨便找乙個人,給你屬性資訊,你給我計算他的性別,於是你可以用條件概率公式來給我估計出他是男的或女的的概率。
貝葉斯分類
樸素貝葉斯模型是一組非常簡單快速的分類演算法,通常適用於維度非常高的資料集,因為執行速度快,而且可調引數少,因此非常適合為分類問題提供快速粗糙的基本方案。貝葉斯分類 樸素貝葉斯分類器建立在貝葉斯分類方法上,其數學基礎是貝葉斯定理,乙個描述統計計量條件概率關係的公式。在貝葉斯分類中,我們希望確定乙個具...
樸素貝葉斯分類
1 貝葉斯分類是一類分類演算法的總稱,這類演算法均以貝葉斯定理為基礎,故統稱為貝葉斯分類。2 樸素貝葉斯的思想基礎是這樣的 對於給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬於哪個類別。通俗來說,就好比這麼個道理,你在街上看到乙個黑人,我問你你猜這哥們 來的,...
樸素貝葉斯分類
摘自寫在公司內部的wiki 要解決的問題 表中增加欄位classification,有四個取值 0 初始值,未分類 1 positive 2 normal 99 negative review submit前,由樸素貝葉斯分類器決定該條review的flag屬於negative還是positive ...