今天我把這些問題的細節做了一些改善,重新做了模型,發覺模型結果比我預想中的要棒!!主要修改如下:
1、將鄰居矩陣從2維擴充為35維;(據我測算,一般為整個資料集中使用者數的5%最佳,50維出現了一些空值)
2、將歐氏距離上限標準化去掉,這樣能更有效的匹配到相似度更高的使用者。
後續在執行推薦演算法的過程中發現,乙個乙個計算每乙個使用者的推薦產品太傻,我需要來乙個迴圈語句來執行推薦演算法!
過程中主要問題如下:
1、並不是所有使用者都有相似使用者,在執行語句中會報錯——這裡我需要乙個語句能識別報錯並跳過繼續執行;
2、如何把所有執行的結果放入乙個矩陣,並且識別是哪乙個使用者——這裡需要乙個空矩陣將使用者id和結果裝入。
最終**編寫如下:
#組建初始化空矩陣
r#迴圈執行推薦程式並將結果併入到空矩陣
for (i in 1:nrow(s))
#迴圈執行推薦程式
try(
,silent = t)
#刪除結果矩陣1,2行以及第一列
cwrite.csv(c,file = 'hnjbtj1.csv')
結果如下:
R語言執行shiny的函式報錯的解決辦法
今天記錄乙個r語言中報錯的解決辦法。shiny執行runexample 01 hello 或者其他函式使出現報錯,如下 我嘗試了很多解決辦法,在網上找了多篇教程,有的說重新安裝r語言或者rstudio,也多次嘗試了重新安裝shiny包以及配置環境,但都沒有達到目的。在多次嘗試之後,我找到了乙個比較笨...
R語言報錯原因
in gsub sprintf ucp b s b paste sort words,decreasing true 出現這個錯誤的原因是我的stopwords裡存在非utf 8的元素 可以使用encoding函式檢視,解決方法就是,把那些字元去掉就行.stopwords stopwords enc...
r語言summary函式使用 R語言方法總結
計算描述性統計量 summary 例 summary mtcars vars summary 函式提供了最小值 最大值 四分位數和數值型變數的均值,以及因子向量和邏 輯型向量的頻數統計。函式或函式 計算所選擇的任意描述性統計量。mean sdvar minmax median length rang...