11 分類與監督學習,樸素貝葉斯分類演算法

2022-08-31 20:30:19 字數 1484 閱讀 4098

1.理解分類與監督學習、聚類與無監督學習。

簡述分類與聚類的聯絡與區別。

聯絡:分類與聚類都是在資料集中尋找離自己最近的點

區別:分類是一種有監督學習,目的是為了確定點的類別,而類別是已知的;聚類是一種無監督學習,目的是將點分為成若干個類,事先是沒有類別的。

簡述什麼是監督學習與無監督學習。

監督學習:在監督學習中的資料是帶有標籤的,知道輸入和輸出結果之間的關係,通過訓練得到乙個最優的模型

無監督學習:在無監督學習中資料是沒有標籤·的,不清楚資料、特徵之間的關係,比起監督學習,無監督學習更像是讓機器學會自己做事,自學

2.樸素貝葉斯分類演算法 例項

利用關於心臟病患者的臨床歷史資料集,建立樸素貝葉斯心臟病分類模型。

有六個分類變數(分類因子):性別,年齡、killp評分、飲酒、吸菸、住院天數

目標分類變數疾病:

–心梗–不穩定性心絞痛

新的例項:–(性別=『男』,年齡<70, killp=『i',飲酒=『是』,吸菸≈『是」,住院天數<7)

最可能是哪個疾病?

上傳手工演算過程。

性別年齡

killp

飲酒吸菸

住院天數疾病男

>80是是

7-14心梗女

70-80否是

<7心梗女

70-81否否

<7

不穩定性心絞痛

女<70否是

>14心梗男

70-80是是

7-14心梗女

>80否否

7-14心梗男

70-80否否

7-14心梗女

70-80否否

7-14心梗女

70-80否否

<7心梗男

<70否否

7-14心梗女

>80否是

<7心梗女

70-80否是

7-14心梗女

>80否是

7-14

不穩定性心絞痛

男70-80是是

>14

不穩定性心絞痛

女<70否否

<7心梗男

70-80否否

>14心梗男

<70是是

7-14心梗女

70-80否否

>14心梗男

70-80否否

7-14心梗女

<70否否

<7

不穩定性心絞痛

3.使用樸素貝葉斯模型對iris資料集進行花分類。

嘗試使用3種不同型別的樸素貝葉斯:

並使用sklearn.model_selection.cross_val_score(),對各模型進行交叉驗證。

11 分類與監督學習,樸素貝葉斯分類演算法

老師 missdu 提交作業 1.理解分類與監督學習 聚類與無監督學習。簡述分類與聚類的聯絡與區別。簡述什麼是監督學習與無監督學習。答 監督學習 根據已有的資料集,知道輸入和輸出結果之間的關係。根據這種已知的關係,訓練得到乙個最優的模型。無監督學習 我們不知道資料集中資料 特徵之間的關係,而是要根據...

11 分類與監督學習,樸素貝葉斯分類演算法

1.理解分類與監督學習 聚類與無監督學習。簡述分類與聚類的聯絡與區別。簡述什麼是監督學習與無監督學習。2.樸素貝葉斯分類演算法 例項 利用關於心臟病患者的臨床歷史資料集,建立樸素貝葉斯心臟病分類模型。有六個分類變數 分類因子 性別,年齡 killp評分 飲酒 吸菸 住院天數 目標分類變數疾病 心梗 ...

機器學習學習筆記之 監督學習之樸素貝葉斯分類器

樸素貝葉斯分類器的訓練速度比線性模型更快。這種高效率所付出的代價是,樸素貝葉斯模型的泛化能力要比線性分類器 如 logisticregression 和 linearsvc 稍差。樸素貝葉斯模型如此高效的原因在於,它通過單獨檢視每個特徵來學習引數,並從每個特徵中收集簡單的類別統計資料。scikit ...