這本天書簡直就讓人摸不到頭腦,翻到二十多頁已然是看不懂了。在懶人床的指點下,好歹有了一些想法。所以寫下這個部落格,為了讓跟我一樣看天書的小夥伴們一點幫助。
樣本w1
w2w3
x1x2
x3x1
x2x3
x1x2x31
-5.01
-8.12
-3.68
-0.91
-0.18
-0.05
5.35
2.26
8.13
2-5.43
-3.48
-3.54
1.30
-2.06
-3.53
5.12
3.22
-2.66
31.08
-5.52
1.66
-7.75
-4.54
-0.95
-1.34
-5.31
-9.87
40.86
-3.78
-4.11
-5.47
0.50
3.92
4.48
3.42
5.19
5-2.67
0.63
7.39
6.14
5.72
-4.85
7.11
2.39
9.21
64.94
3.29
2.08
3.60
1.26
4.36
7.17
4.33
-0.98
7-2.51
2.09
-2.59
5.37
-4.63
-3.65
5.75
3.97
6.65
8-2.25
-2.13
-6.94
7.18
1.46
-6.66
0.77
0.27
2.41
95.56
2.86
-2.26
-7.39
1.17
6.30
0.90
-0.43
-8.71
101.03
-3.33
4.33
-7.50
-6.32
-0.31
3.52
-0.36
6.43
複述一下題目:
下面開始攻堅。。。
首先,馬氏距離是什麼呢:
這就是馬氏距離的計算公式,去掉他根號下的s-1,便是歐式距離。
至於他們之間的區別,可以參考
大體內容就是:
如果我們以厘公尺為單位來測量人的身高,以克(g)為單位測量人的體重。每個人被表示為乙個兩維向量,如乙個人身高173cm,體重50000g,表示為(173,50000),根據身高體重的資訊來判斷體型的相似程度。
我們已知小明(160,60000);小王(160,59000);小李(170,60000)。根據常識可以知道小明和小王體型相似。但是如果根據歐幾里得距離來判斷,小明和小王的距離要遠遠大於小明和小李之間的距離,即小明和小李體型相似。這是因為不同特徵的度量標準之間存在差異而導致判斷出錯。
以克(g)為單位測量人的體重,資料分布比較分散,即方差大,而以厘公尺為單位來測量人的身高,資料分布就相對集中,方差小。馬氏距離的目的就是把方差歸一化,使得特徵之間的關係更加符合實際情況。
圖(a)展示了三個資料集的初始分布,看起來豎直方向上的那兩個集合比較接近。在我們根據資料的協方差歸一化空間之後,如圖(b),實際上水平方向上的兩個集合比較接近。
ok,了解了馬氏距離還有它的公式,我們就可以開始了。
根據計算公式,我們現在有了測試點的座標了,還需要求出均值「u(繆)」。我們用python實現。
現在求出了u,還需要求協方差矩陣s-1.我們同樣用python實現。
現在解出第一題了。
然後對各點進行分類。
利用貝葉斯決策論的內容即可,留個坑。
SDU機器學習作業心得5
軟體16 6 李昊 201600301309 注意!使用svm之前請先解壓.dataforsvm.zip。mnist.pkl.gz上次實驗已經上傳過了,這次不再上傳,執行之前請把它放到當前目錄下。繼上次實驗用bp神經網路處理完mnist資料集之後,我們這次的任務是用多個模型進行投票,組成乙個整合學習...
練習作業1
一 使用while迴圈輸入 1 2 3 4 5 6 7 8 9 1 count 1 while count 11 if count 7 print else print count count 1 二 求1 100所以自然數之和 1 x 1 2 s 0 3while x 101 4 s s x 5 ...
2013 7 15學習作業
題目1 int a 3 a 0 0 a 1 1 a 2 2 int p,q p a q a 2 a q p 的值是多少?為什麼?include using namespace std int main int argc,const char ar 題目2 const 有什麼用途?請用附上 例子佐證 ...