鳶尾花分類 機器學習 分門別類 分類器

2021-10-14 21:39:44 字數 1023 閱讀 7334

分類器就是乙個由特徵向量到**類別的函式。在鳶尾花的分類問題中,我們用+1和-1兩個值分別代表變色鳶尾和山鳶尾兩個類別,並用字母y表示,即y可以取+1和-1兩個值。前面我們已經提取了鳶尾花的特徵,將它表示為特徵向量,並把特徵向量畫在了特徵空間。從下圖(一)看,對鳶尾花品種分類的問題就轉變成在特徵空間中將一些特徵點分開的問題。如果我們用直線作為分界線,那麼這個問題就變成:座標平面中有兩類點,畫一條直線將這兩類點分開。

圖(1)

我們可以輕而易舉地在圖中畫出一條直線0.5x₁+x₂-2=0,它將整個座標平面分為兩個區域。若使落在直線的特徵點輸出+1,代表變色鳶尾;落在直線左下區域的特徵輸出-1,代表山鳶尾,應用這樣的規則,我們就能夠得到將鳶尾花正確分類的分類器,這規則代表的分類器可以用下面的函式表示:

+1, 0.5x₁+x₂-2≥0

g(x₁,x₂)=

-1, 0.5x₁+x₂-2<0

期中,0.5x₁+x₂-2和圖中所畫的直線有著對應關係,我們把它記為f (x₁,x₂)。如果f (x₁,x₂)≥0,就表示特徵點(x₁,x₂)在直線的右上區域;反之,表示特徵點在直線的左下區域。

f(x) 是分類函式g(x)的核心。f(x)的不同,相當於在圖(1)中畫了不同的線用來分開不同的類。函式f (x) 的形式多樣,具有 f(x₁,x₂,.......xn )=ɑ1x1+ ɑ2x2+......+ɑnxn+b形式的分類器被稱為線性分類器,期中n是特徵向量維數。ɑ1,ɑ2,...ɑn,b是函式的係數,被稱為分類器的引數。在上面的列子中,0,5,1,-2就是分類器的引數的取值。

特徵向量 分類器ɡ(x) 類別

(x1,x2,x3) 引數 y

在區分鳶尾花品種的簡單例子中,我們可以直接畫出一條直線將兩類點分開。實際情況中,特徵點在特徵空間中的位置分布非常複雜,採用觀察和嘗試來畫出分類直線往往是不可能的,也是沒有效率的。因此,需要通過一些方法,讓分類器自己學習得到分類直線。

鳶尾花分類 機器學習 鳶尾花資料集 貝葉斯分類

step1 庫函式匯入 import warnings warnings.filterwarnings ignore import numpy as np 載入鶯尾花資料集 from sklearn import datasets 匯入高斯樸素貝葉斯分類器 from sklearn.bayes im...

Python 機器學習 鳶尾花分類

python 機器學習 鳶尾花分類 匯入類庫 from pandas import read csv from pandas.plotting import scatter matrix from matplotlib import pyplot from sklearn.model selecti...

Keras 學習筆記5 多分類例項 鳶尾花分類

from sklearn import datasets import numpy as np from keras.models import sequential from keras.layers import dense from sklearn.model selection import...