推薦模型演化:
協同過濾:
usercf:基於使用者相似度
itemcf:基於物品相似度
相似度計算:cosine similarity、皮爾遜相關係數(引入使用者平均分,減少了使用者評分偏置影響)、還可以引入物品平均分,減少物品評分偏置對結果的影響
usercf具備強的社交特性,itemcf適用於興趣變化比較穩定的應用
矩陣分解:
使用者和物品的隱向量是通過分解協同過濾生成的共現矩陣得到的
分解方法:
特徵值分解:只能用於方陣
svd:
gradient decent
用regularization防止過擬合:模型權重的q次方,q=1為l1 regularization,q=2為l2 regularization
特徵兩兩交叉
1.引入了隱向量,可以把權重引數n^2 -> nk
2.解決資料稀疏的問題,泛化能力提高
引入了特徵域
gbdt + lr:
利用gbdt自動進行特徵篩選和組合,生成新的離散特徵向量,把特徵向量當作lr的輸入
端到端非線性學習能力
用了l1 regularization,更容易求得稀疏解
python深度學習第二章筆記
2.1mnist例項 coding utf 8 project python深度學習 file name 2.1mnist author win10 time 2020 4 11 11 22 product name pycharm from keras.datasets import mnist ...
通訊系統 第二章
這章主要回顧了訊號與系統的內容。示波器在時域觀察訊號,頻譜分析儀在頻域觀察訊號。訊號分類 確定 隨機,能量 功率,週期 非週期,復 實,連續 離散 功率訊號其實並不是真實的,因為它要求時間無限長,能量無限大。但因為在數學上處理方便,所以即使不現實,還是保留了下來。這點上有點類似於負頻率。脈衝 大部分...
深度學習筆記(二)第二章 線性代數
標量 scalars 向量 vector 矩陣 matrix 矩陣和向量乘法 hadamard積 a b c ab ac 2.6 a bc ab c 2.7 單位矩陣 單位矩陣和矩陣的逆 線性依賴和空間 span 解決公式2.11是否有解的問題。乙個有線性依賴的方陣叫奇異矩陣。範數 norms p ...