github上的專案,跟著一起學習
專案位址
1、什麼是svm
有監督可用於分類和回歸,主要用於分類
根據特徵值,構建n維空間,資料點投影到該空間
2、資料如何分類
找到乙個超平面
3、如何定義最佳超平面
最大化乙個距離,這個距離是到超平面最近的點的距離
4、線性和非線性資料
線性資料直接用超平面劃分
非線性資料,需變換到另乙個空間,再劃分
5、引數
核函式(kernel):尋找超平面,就是通過線性袋鼠轉化問題。通過核函式來完成。
正則化(regularization):較大時,選較小間距的超平面
係數(gamma):小的系數值,距離遠的點也會用於計算
間距(margin):到最近點的分界線
學習《機器學習100天》第25天 隨機森林
github上的專案,跟著一起學習 專案位址 隨機森林 有監督 整合學習模型 建立很多決策樹,再整合 主要用於分類和回歸 隨機森林與決策樹的區別 隨機森林中,查詢根節點和分割特徵節點的過程是隨機進行的。決策樹的構建方式 1.隨機選取資料 訓練集n個樣本,有放回的隨機抽取n個 2.特徵的隨機選取 樣本...
100天搞定機器學習
新增好友麻煩備註 github 100天搞定機器學習 day1資料預處理 100天搞定機器學習 day2簡單線性回歸分析 100天搞定機器學習 day3多元線性回歸 100天搞定機器學習 day4 6 邏輯回歸 100天搞定機器學習 day7 k nn 100天搞定機器學習 day8 邏輯回歸的數學...
python學習第12天
一.迭代器 1.概念 迭代器指的是迭代取值的工具,迭代是乙個重複的過程,每次重複都是基於上一次的結果而繼續,單純的重複不是迭代 2.特徵 不依賴索引,通過next指標迭代所有資料,一次只取乙個,可以大大節省空間,迭代無限量的資料 3.可迭代物件 如果成員中含有 iter 這個方法,就是可迭代物件 d...