根據使用者15個月商品購買記錄(2023年1月28日到2023年5月使用者購買商品記錄),**下個月(2023年6月)哪些使用者最可能購買的7個商品。
融合模型。
模型融合演算法效果不好。商品分布跟月份相關,只使用2023年6月的測試資料來**2023年6月份的使用者購買行為。資料量大大縮小。
有的使用者2023年6月之後才有資訊記錄,還是用2023年5月**
模型融合。
2023年6月和2023年5月都出現,融合
2023年6月和2023年5月只出現一次,當作結果
2023年6月和2023年5月都不出現,**不購買
不**你購買商品,而是假定使用者購買商品,**使用者會購買哪些商品。multi:softprob。
xgb_params =
每條記錄使用者購買了多個商品,將該記錄拆分多條,每條記錄乙個商品
train取出labely,按asix=0軸拼接train、test集,一起預處理。
seaborn使用scatter圖。
方差越來越大。log。證明
幾個偏差特別大的雜訊點。如果在train,直接去除,如果在test,賦值na,後邊會單獨處理na值
seaborn使用heatmap圖,
檢視特徵相關pearson係數,相關較大的,去除一列,先效果。
降維效果不好。去除幾列與結果關係不大的列
非數值型別轉數值型別。
有的樣本在train全,test有缺失值。
heatmap圖,相關性較大的列的值處理後填充
rf**
好多列的資料都缺失,直接刪除該樣本。
去除缺失值特別多的列。
特徵組合。比如工資和退休金組合。房屋資訊、幾個車庫。
引數調整。gridsearchcv。
k折交叉驗證。sklearn.cross_validation.kfold
京東商品推薦系統
京東商品推薦系統 個性化推薦是根據使用者的興趣特點和購買行為,向使用者推薦使用者感興趣的資訊和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的資訊和產品過程無疑會使淹沒在資訊過載問題中的消費者不斷流失。為了解決這些問題,京東商...
django 推薦商品演算法
1.基於使用者的協同過濾演算法 usercf 該演算法利用使用者之間的相似性來推薦使用者感興趣的資訊,個人通過合作的機制給予資訊相當程度的回應 如評分 並記錄下來以達到過濾的目的進而幫助別人篩選資訊,回應不一定侷限於特別感興趣的,特別不感興趣資訊的紀錄也相當重要。但有很難解決的兩個問題,乙個是稀疏性...
利用svd進行使用者商品推薦的小實踐
from numpy import from numpy import linalg as la def ecludsim ina,inb return 1.0 1.0 la.norm ina inb def cossim ina,inb num float ina.t inb denom la.n...