統計語言模型:
馬爾可夫鏈,模型訓練,零概率平滑
隱馬爾可夫鏈:
概率訓練,鮑姆-韋爾奇演算法
資訊度量和作用:
資訊熵,互資訊,聯合概率分布、相對熵
簡單之美-布林袋鼠和搜尋引擎的索引:
文獻搜尋
圖論和網路爬蟲:
最短路徑,網路爬蟲,雜湊表,工程要點(dfs,bfs,頁面分析和url提取,url表)
pagerank-google的民主表決式網頁排名技術:
布林地圖和本地搜尋的最基本技術-有限狀態機和動態規劃:
位址分析,全球導航
餘弦定理和新聞分類:
新聞的特徵向量,向量距離的度量,計算余弦向量的技巧
矩陣運算和文字分類處理中的兩個問題:
奇異值分解
資訊指紋及其應用:
梅森旋轉演算法,判定集合相同或基本相同
由電視劇集《暗算》所想到的-談談密碼學的數學原理:
資訊理論閃光的不一定是金子-談談搜尋引引擎反作弊問題:
解卷積,圖論
不要把雞蛋放到乙個籃子裡-談談最大熵問題:
將不同資訊整合到統一的模型中
拼音輸入法的數學原理:
編碼,敲擊鍵數,通訊問題
布隆過濾器:
判斷乙個元素是否在集合中,速度快,但是有一定的誤識別率
馬爾可夫鏈的擴充套件:貝葉斯網路
分類條件隨機場與句法分析:
計算聯合分布概率
維位元和他的維位元演算法:
籬笆網路有向圖最短路徑,動態規劃演算法,(數字通訊,語音識別,機器翻譯,拼音轉漢字,分詞),cdma技術
再談文字自動分類問題-期望最大演算法:
上帝演算法,文字自分類演算法
邏輯回歸和搜尋廣告:
將影響概率的不同因素結合在一起的指數模型
各個擊破演算法和google雲計算的基礎:
分治理演算法到mapreduce
《數學之美》讀後感
暑假的時候導師給我推薦了一本 數學之美 作為語音識別入門性的讀物。實話說來從小學到高中再到大學我們一直在學習數學,除了一些基本的加減乘除可以在生活中直接用到。其他的例如 倒數 微積分 各種函式 矩陣 幾乎在日常的生活中與自己沒有什麼交集。最近這個週末我在實驗室裡又將這本書重新閱讀了一筆,才發現數學原...
《數學之美》讀後感
近日拜讀了吳軍博士的 數學之美 感觸很深。對於我個人來說,這本書給我的最大驚喜就是吳軍博士將數學理論與他在實際工業界中的作用聯絡起來,看過我之前一些博文的可能發現,我自己最近在學習機器學習,但學習機器學習有個問題就是理論高深,枯燥,而且在學習的過程中比較難以落地,不知道自己學習的東西究竟在 發揮作用...
數學之美讀後感
複雜與簡單,技與術 數學之美 最初是 於google黑板報上的一系列半科普半技術性質的部落格,有google的吳軍博士撰寫。文章通俗易懂 深入淺出。不僅用清晰的語言描述了一系列他平時接觸到的 高階 技術 很多內容主題猛地一看有種神秘的感覺,但讀完以後卻讓人恍然大悟 原來這不就是我以前知道的 麼 而且...