在分類問題中
二分類:
首先,利用h(x)呈現的是y**為1的概率,利用了sigmoid函式
隨後,利用0.5設界,進行判決
最後,利用已有資料集估計θ,劃定好邊界,邊界設定好後不再受資料集影響
可以參考下圖中給出的例子,兩種邊界,線性與非線性的,考慮多項式回歸
上圖中,有兩個問題並在下圖中給出具體解答
①梯度下降法的求導
②損失函式的得來:mle最大似然估計
具體案例參見課程
引申學習,對比one-vs-all與one-vs-one
①one-vs-all:也可以說是one-vs-rest,在這種策略中,會建立n個二分類器,每個分類器將其中乙個類別定義為正類,將其他rest類別定義為負類。進行**時,利用這n個二分類器進行分類,得到新資料x屬於當前類的概率,並選擇其中概率最大的乙個類別作為最終的**結果。
缺點:存在偏差。
②one-vs-one:在這種策略中,會針對兩兩類別建立二分類器,得到k=n*(n-1)/2個分類器。進行**時,依次使用這k個分類器進行分類,每次分類相當於一次投票,分類結果是哪個就相當於對哪個類投了一票。在使用全部k個分類器進行分類後,相當於進行了k次投票,選擇得票最多的那個類作為最終分類結果。
缺點:代價相對大。
超速學習理論與方法實踐
超速學習理論與方法實踐 在知乎看到了這樣乙個問題 怎樣看待 12 個月內自學完成 4 年麻省理工學院電腦科學的 33 門課程的 scott h.young 所謂的超速學習理論和方法 費曼技巧 以及背後 get more from life 的理念?很久之前就讀過scott young的 如何高效學習...
深度學習理論學習 03
經過了理論上的熟悉和入門之後,接下來的內容主要就是進行環境的搭建和 的編寫測試上了。那麼這一篇文章的主要內容基本就是環境的搭建。目前網上和教材上很多環境都是ubuntu tensorflow,但是我在暑假裝機的時候已經安裝了win10的系統,而且經過學長們的指點,其實在win環境下也是能夠安裝ten...
機器學習 理論知識 實踐 KNN演算法
5knn引數說明 從訓練集合中獲取k個離待 樣本距離最近的樣本資料 根據獲取得到的k個樣本資料來 當前待 樣本的目標屬性值。在knn回歸應用中,一般採用平均值法或者加權平均值法。kd樹採用從m個樣本的n維特徵中,分別計算n個特徵取值的方差,用方差最大 的第k維特徵n kn k nk 作為根節點。對於...