一開始直接就下了blei的原始的那篇**來看,但是看了個開頭就被dirichlet分布和幾個數學公式打倒,然後因為專心在寫專案中的具體的**,也就先放下了。但是因為發現完全忘記了本科學的概率和統計的內容,只好回頭去看大學時候概率論的教材,發現早不知道借給誰了,於是上網買了本,花了幾天時間大致回顧了一遍概率論的知識,什麼貝葉斯全概率公式,正態分佈,二項分布之類的。
後來晚上沒事兒的時候,去水木的ai版轉了轉,了解到了machine learning的聖經prml,考慮到反正也是要長期學習了,搞了電子版,同時上**買了個列印膠裝的版本。春節裡每天晚上看一點兒,掃了一下前兩章,再次回顧了一下基本數學知識,然後了解了下貝葉斯學派那種採用共軛先驗來建模的方式。於是再次嘗試回頭去看blei的那篇**,發現還是看不太懂,於是又放下了。
然後某天tony讓我準備準備給復旦的同學們share一下我們專案中lda的使用,為了不露怯,又去翻**,正好看到science上這篇topic models vs. unstructured data的科普性質的文章,翻了一遍之後,再去prml裡看了一遍graphic models那一張,覺得對於lda想解決的問題和方法了解了更清楚了。之後從search engine裡搜到這篇文章,然後根據推薦讀了一部分的gibbs sampling for the uninitiated。
之後忘了怎麼又搜到了mark steyvers和tom griffiths合著的probabilistic topic models,在某個週末往返北京的飛機上讀完了,覺得基本上模型訓練過程也明白了。
再之後就是讀了一下這個最簡版的lda gibbs sampling的實現.
再回過頭讀了一下plda的原始碼,基本上算是對lda有了個相對清楚的了解。
李開復對於程式設計師的演算法學習建議
給程式設計師的七個建議 1 練內功。不要只花功夫學習各種流行的程式語言和工具,以及某些公司招聘廣告上要求的科目。要把資料結構 演算法 資料庫 作業系統原理 計算機體系結構 計算機網路,離散數學等基礎課程學好。大家不妨試試高德納所著the art of computer programming裡的題目...
程式設計師的七建議
給程式設計師的七個建議 1 練內功。不要只花功夫學習各種流行的程式語言和工具,以及某些公司招聘廣告上要求的科目。要把資料結構 演算法 資料庫 作業系統原理 計算機體系結構 計算機網路,離散數學等基礎課程學好。大家不妨試試高德納所著the art of computer programming裡的題目...
前輩程式設計師的建議
本文是從 advice from an old programmer 這篇文章翻譯而來。本文是 learn python the hard way,2nd edition 這本書的尾聲部分。看完了這本書,你決定繼續做程式設計。也許它能成為你的乙個職業,也許它能成為你的一項愛好。但你需要一些指導,確保...