配置學習演算法:onlinelogisticregression傳入了三個引數(目標向量的個數,特徵向量的大小以及正則化項)
this.learningalgorithm = new onlinelogisticregression(dictionary.size(), features, new l1())
.alpha(1) // 學習率
.stepoffset(1000) // 衰減方式
.decayexponent(0.9) // 衰減率
.lambda(3.0e-5) // 正則化權重
.learningrate(20); // 初始學習率
1》new l1()
不清楚為什麼這麼來,只是看書是這樣的,暫時先不寫。
2》特徵向量的大小
3》目標向量的個數
mahout 分類演算法
資料探勘有很多的領域,分類是其中之一,分類就是把一些新的資料項對映到給定類別的中的某乙個類別,比如當我們發表一篇文章的時候,就可以自動的把這篇文章劃分到某乙個文章類別,一般的過程是根據樣本的資料利用一定的分類演算法,得到分類規則,新的資料過來就依據該規則進行類別的劃分。分類在資料探勘中是一項非常重要...
Mahout安裝與配置
一 安裝mahout 2 解壓至指定目錄 我平時都存放在opt下面 建立存放目錄 root master opt mkdir mahout 進入資料夾 root master opt cd mahout 3 配置環境變數 執行命令 root master opt mahout gedit etc p...
Mahout安裝與配置
一 安裝mahout 2 解壓至指定目錄 我平時都存放在opt下面 建立存放目錄 root master opt mkdir mahout 進入資料夾 root master opt cd mahout 3 配置環境變數 執行命令 root master opt mahout gedit etc p...