《美團機器學習實踐》隨筆(一)

2021-09-22 12:23:31 字數 637 閱讀 1276

特徵選擇

工具eda(探索性資料分析)

採用各種技術(大部分為視覺化技術)在盡量少的先驗假設條件下,探索資料內部結構和規律的一種資料分析方法或理念 。

數值特徵

資料應滿足模型的一些隱式或者顯示的假設,例如:線性回歸訓練使用平方損失函式等價於假設**誤差服從高斯分布。

類別特徵

時間特徵

空間特徵

文字特徵

skip-gram模型

余弦相似度

jaccard相似度

levenshtein(編輯距離)

隱性語義分析:奇異值分解(svd)

word2vec

過濾方法

封裝方法

封裝方法直接使用機器學習演算法評估特徵子集的效果 ,它可以檢測出兩個或者多個特徵之間的互動關係 ,而且選擇的特徵子集讓模型的效果達到最優。

嵌入方法

嵌入方法則將特徵選擇嵌入到模型的構建過程中,具有封裝方法與機器學習演算法相結合的優點,而且具有過濾方法計算效率高的優點。

嵌入方法

一般機器學習包的線性模型都支援l

1l_1

l1​正則,如 sparkmllib和 skleam等。

參考文獻

《美團機器學習實踐》

評書 《美團機器學習實踐》

新入手一本 美團機器學習實踐 讀完覺得很有意思,把一部分內容分享給大家。美團可以說是當之無愧的國內最大的poi和o2o應用的公司,他們在這方面的經驗積累極多,架構非常漂亮,而且即使我這個不大了解這方面的人讀起來,也能對機器學習在poi和o2方面的應用有大致的了解。接下來筆者將介紹一些自己覺得很有趣的...

美團推薦演算法實踐

推薦系統並不是新鮮的事物,在很久之前就存在,但是推薦系統真正進入人們的視野,並且作為乙個重要的模組存在於各個網際網路公司,還是近幾年的事情。隨著網際網路的深入發展,越來越多的資訊在網際網路上傳播,產生了嚴重的資訊過載。如果不採用一定的手段,使用者很難從如此多的資訊流中找到對自己有價值的資訊。解決資訊...

美團機器學習實踐第四章 模型融合總結

思維導圖如下 模型融合是一種有效提公升機器學習效果的方法,通過構建並融合多個模型來完成學習任務。模型融合主要包含兩個階段 構建若干單模型和模型融合。如果模型融合使用的單模型屬於一類學習演算法,這樣的融合稱為同質模型融合,如果模型融合使用多種不同的學習演算法構建的單模型,這樣的融合稱為異質模型融合。1...