機器學習錯題集

2021-08-28 12:02:33 字數 1210 閱讀 8912

1.線性分類器有三大類:感知器準則函式、svm、fisher準則,而貝葉斯分類器不是線性分類器。

感知器準則函式:代價函式j=-(w*x+w0),分類的準則是最小化代價函式。感知器是神經網路(nn)的基礎,網上有很多介紹。

svm:支援向量機也是很經典的演算法,優化目標是最大化間隔(margin),又稱最大間隔分類器,是一種典型的線性分類器。(使用核函式可解決非線性問題)

fisher準則:更廣泛的稱呼是線性判別分析(lda),將所有樣本投影到一條遠點出發的直線,使得同類樣本距離盡可能小,不同類樣本距離盡可能大,具體為最大化「廣義瑞利商」。

貝葉斯分類器:一種基於統計方法的分類器,要求先了解樣本的分布特點(高斯、指數等),所以使用起來限制很多。在滿足一些特定條件下,其優化目標與線性分類器有相同結構(同方差高斯分布等),其餘條件下不是線性分類

2.類概率密度與先驗概率的乘積
所謂判別式模型,需要把正負樣本區分開,那勢必會遇到區分不開的情形,這時就要用到核函式了,那所以我認為判別式模型都要用核函式的。

radial basis function

linear discrimimate analysis
support vector machine
hmm三大問題

a、b:前向、後向演算法解決的是乙個評估問題,即給定乙個模型,求某特定觀測序列的概率,用於評估該序列最匹配的模型。

c:baum-welch演算法解決的是乙個模型訓練問題,即引數估計,是一種無監督的訓練方法,主要通過em迭代實現;

d:維特比演算法解決的是給定 乙個模型和某個特定的輸出序列,求最可能產生這個輸出的狀態序列。如通過海藻變化(輸出序列)來觀測天氣(狀態序列),是**問題,通訊中的解碼問題。

對於二類分類問題常用的評價指標是精準度(precision)與召回率(recall)。通常以關注的類為正類,其他類為負類,分類器在測試資料集上的**或正確或不正確,4種情況出現的總數分別記作:

tp——將正類**為正類數

fn——將正類**為負類數

fp——將負類**為正類數

tn——將負類**為負類數

由此:精準率定義為:p = tp / (tp + fp)

召回率定義為:r = tp / (tp + fn)

f1值定義為: f1 = 2 p r / (p + r)

精準率和召回率和f1取值都在0和1之間,精準率和召回率高,f1值也會高,不存在數值越接近0越高的說法,應該是數值越接近1越高。

C C 練習錯題集

單選題 若int 佔 2 個位元組,char 佔 1 個位元組,float 佔4 個位元組,sizeof xc 大小是 struct stu class char xm 8 float cj xc sizeof xc 大小是 20 記憶體對齊規則 結構體的總大小為結構體最寬基本型別的整數倍 聯合體裡...

C語言錯題集

c語言錯題集 1 continue 不是結束本次迴圈,而是終止整個迴圈的執行。錯誤 用continue語句提前結束本次迴圈 2 直接訪問就是直接利用變數的位址進行訪問直接訪問 正確3 共用體變數可以作結構體的成員,結構體變數也可以作共用體的成員。正確4 列舉型別中的元素都具有乙個整型值。正確5 函式...

c語言錯題集

在 c 語言程式中 凡是沒有出現儲存類說明符的變數都是自動類的。1分 t f正確答案是t 兩指標變數相減所得之差是兩個指標所指陣列元素之間相差的元素個數。1分 t f正確答案是t 根據宣告int a 10 p a 下列表示式錯誤的是 d 2分 a 9 p 5 a p 以下陣列定義中錯誤的是 2分 i...