1、knn (k近鄰)vs 決策樹 分類演算法
k近鄰演算法可以完成很多分類任務,但是它最大的缺點就是無法給出資料的內在含義。它是通過計算點位間的距離來決定相似度的,其執行效率不高,儲存空間和計算時間比較長。
決策樹的主要優勢就在於資料形式非常容易理解。相似例子:二十個問題遊戲,參與者在腦海裡想出一種事物,其他參與者向他提問,只允許體20個問題,問題的答案也只能回答是或者否。問問題的人通過推斷分解,逐步縮小待猜測事物的範圍。
缺點:可能會產生過度擬合問題
適用資料型別:數值型和標稱型。
機器學習 K means實踐
這兩天跟著 機器學習實戰 那本書學習了一下聚類方法中的k means演算法。在本篇文章中主要介紹下實踐中遇到的問題以及演算法的主要思想。ok,here we go!k means演算法思想 我們在日常生活中經常會遇到將某些相似的事物進行聚類,而如何讓計算機幫助我們進行自動的分類呢?k means是經...
機器學習 EM實踐
import numpy as np from scipy.stats import multivariate normal from sklearn.mixture import gaussianmixture from mpl toolkits.mplot3d import axes3d fro...
機器學習總結
1.常用的機器學習演算法包括 監督學習 半監督學習 無監督學習 增強學習 遺傳演算法 監督學習 就是人為的設定規則,告訴機械人該執行怎麼樣的行動。無監督學習就是不告訴機械人具體的實施辦法,只給定規則,讓機械人過程當中自己學習總結經驗 半監督學習就是結合少標籤的樣本和大量無標籤的樣本進行學習和分類 強...