最近實習的導師交給我乙個跟深度學習有關的專案,於是研究了一下其中的乙個分支文字分類,自然免不了要認真研讀一下google開源的word2vec專案,本來想寫一篇博文詳細解析一下其中的演算法和具體的**,不過感覺網上的很多文章寫得非常好,我也是參考了它們才勉強對這個專案有了一點理解,就不班門弄斧了,先將一些我覺得不錯的博文貼在下面,以供檢視:
1、word2vec 中的數學原理詳解
最初看到了乙個系列博文寫的很好,相信很多人都看過,我也是因為這篇文章才對word2vec算是入了點門,主要講解word2vec中涉及到的兩個主要的演算法,比較好的一點是補充了很多準備知識,非常方便理解
2、word2vec原始碼解析
3、word2vec原始碼解析之word2vec.c
最後這篇對**進行了注釋,也值得一看。不過其實之前還看到過一篇註解更為詳細的,只是一時找不到了,日後找到的話再貼上來
一文弄懂word2vec 從原始碼解析
三 trick 四 比較 五 最佳實踐 word2vec並非指乙個模型,而是2013年google開源的乙個獲取詞向量的工具包,由於簡單高效,大大降低了詞向量在工業界的應用門檻。我們先來看下word2vec能夠取得的效果 相似詞 通過向量間距離的遠近來尋找相似詞,如man的相似詞woman 詞語線性...
與word2vec 原來word2vec那麼簡單
說到word2vec,它可謂非結構化資料裡面的佼佼者,尤其是在推薦和nlp當中,足以體現它的優勢所在,並且多年一直備受工業界喜愛.那麼word2vec到底是怎麼個原理的,發現身邊總是有很多人問,確不能準確的說出為什麼是兩個矩陣,到底是怎麼自動反向傳播的,以及對於softmax之後那麼大的維度資料,是...
word2vec學習參考
最近看nlp的東西比較多。就拿現在google 基於神經網路做的 word2vec 作為部落格的開始吧,今後會陸陸續續補充內容。基本是分4塊內容 1.神經網路語言模型 2.語言模型分層優化 3.word2vec 原理 4.google word2vec 看一點寫一點,先扔些參考資料鏈接上去。附上在研...