資料格式:
"x","y","shape","color","k","k0","xx","xy","yy","a","b","c","bias"
0.923307513352484,0.0135197141207755,21,2,4,8,0.852496764213146,0.0124828536260896,0.000182782669907495,0.923406490600458,0.0778750292332978,0.644866125183976,1
0.711011884035543,0.909141522599384,22,2,3,9,0.505537899239772,0.64641042683833,0.826538308114327,1.15415605849213,0.953966686673604,0.46035073663368,1
0.75118898646906,0.836567111080512,23,2,3,9,0.564284893392414,0.62842000028592,0.699844531341594,1.12433510339845,0.872783737128441,0.419968245447719,1
0.308209649519995,0.418023289414123,24,1,5,1,0.094993188057238,0.128838811521522,0.174743470492603,0.519361780024138,0.808280495564412,0.208575453051705,1
0.849057961953804,0.500220163026825,25,1,5,2,0.720899422757147,0.424715912147755,0.250220211498583,0.985454024425153,0.52249756970547,0.349058031386046,1
0.0738831346388906,0.486534863477573,21,2,6,1,0.00545871758406844,0.0359467208248278,0.236716173379140,0.492112681164801,1.04613986717142,0.42632955896436,1
0.612888508243486,0.0204555552918464,22,2,4,10,0.375632323536926,0.0125369747681119,0.000418429742297785,0.613229772009826,0.387651566219268,0.492652707029903,1
資料第一行為每行資料對應值的變數。資料中間用逗號分割。
使用mahout構建訓練模型:
命令:mahout trainlogistic --input 《輸入檔案路徑》 --output 《輸出檔案路徑》 --target 《要進行分類的目標變數名》 --categories 《目標變數類別的個數》 --predictors < **變數的名稱,多個變數時用空格分割》 --type 《**變數的型別列表》 --feature 《設定用於構建模型的內部特徵向量大小》 --passes 《指定在訓練過程中對訓練資料的複核次數》 --rate《設定初始學習率》
其他的一些命令解釋:
--quiet 產生較少的狀態和進度輸出
--lamdba 控制演算法在最終模型中對變數的抑制程度
--nobias 消除模型中截距項
模型的評估:
mahout runlogistic --input《輸入檔案路徑》 --model《模型檔案路徑》 --auc《讀入資料後列印模型在輸入資料上的auc分值》 --confusion《列印某個閥值的混淆矩陣》
其他一些命令:
--scores 列印每個輸入樣本的目標變數值和分數
C STL 演算法另類使用方法
很多時候我們希望在乙個 vector 或者 list 或者什麼其他東西裡面,找到乙個值在哪個位置,這個時候 find 幫不上忙,而有人就轉而求助手寫迴圈了,而且是原始的手寫迴圈 for int i 0 i vect.size i if vect i value break 如果編譯器把 i 看作 f...
Logistic回歸演算法
今天的文章看一下 機器學習實戰 中提到的logistic回歸演算法。雖然是名稱是回歸,但logistic演算法並不用來進行擬合,主要用來處理分類問題。對於二分類問題,我們假設正類的標籤值為1,反類的標籤值為0,我們可以尋找乙個函式,在給定輸入 樣本特徵值 下,可以輸出0或者1。最好的函式應該是單位階...
pythonpip使用方法 pip使用方法整理
匯出專案已安裝的pip包 pip list 檢視專案中安裝的包 pip freeze requirements.txt 將專案中所用到的第三方庫輸出到requirements.txt中 pip install 版本號 pip install i 本次使用清華源進行安裝 離線安裝第三方庫 一鍵安裝整個...