背景介紹
今年以來,對於大資料十分感興趣,故花了些錢報了個線上大資料培訓課程。陸陸續續有老師和同學推薦數學之美這本書,看過之後確實不錯,特別是將今年來的一些熱點,如自然語言處理,語音識別等數學原理深入淺出的表述,使得像我們這些對數學不太懂又像了解的人大有裨益。
第三章 統計語言模型 第四章 談談分詞 第五章 隱含馬爾可夫模型
第三章主要講述了用數學的方法描述語言規律,賈里尼克對於自然語言處理的出發點為乙個句子是否合理,就看它的可能性大小。而乙個有意義的句子在文字中出現的概率也就是句中每個詞出現位置的概率,而每個詞出現的概率有和前面的每個詞有關。這樣導致十分難以計算。馬爾科夫的觀點為,任意乙個詞出現的概率之和前面乙個詞有關。該章同時講到的統計語言模型的「不平滑」問題,這個需要特別注意。第四章講到有乙個詞的粒度問題,就是漢語中詞是表達意思的最基本單位,再小意思就變了。這解決了我高中的乙個疑問,明明都有比分子更小的組成,為啥所分子是保持化學性質的最小單位。而且現在的中文分詞已經是解決了的問題。
第五章 隱含馬爾科夫模型
原來沒太看懂,但是記住了隱含馬爾科夫是解決大多數自然語言處理問題最為快捷和有效的方法。
第六章 資訊的度量和作用
資訊的作用在於消除不確定性,自然語言處理的大量問題就是尋找相關的資訊。互資訊是解決翻譯中二義性最好的方法。
第七章 賈里尼克和現代語言處理
本章主要介紹的是賈里尼克的生平事蹟,讓我印象最深刻的是關於教育的看法,小學生和中學生沒有必要花那麼多時間讀書,而他們的社會經驗、生活能力以及在那時樹立起的志向將幫助他們的一生 。
其次因為興趣而讀書的人往往成就更高。
數學之美讀後感
統計語言模型 馬爾可夫鏈,模型訓練,零概率平滑 隱馬爾可夫鏈 概率訓練,鮑姆 韋爾奇演算法 資訊度量和作用 資訊熵,互資訊,聯合概率分布 相對熵 簡單之美 布林袋鼠和搜尋引擎的索引 文獻搜尋 圖論和網路爬蟲 最短路徑,網路爬蟲,雜湊表,工程要點 dfs,bfs,頁面分析和url提取,url表 pag...
《數學之美》讀後感
暑假的時候導師給我推薦了一本 數學之美 作為語音識別入門性的讀物。實話說來從小學到高中再到大學我們一直在學習數學,除了一些基本的加減乘除可以在生活中直接用到。其他的例如 倒數 微積分 各種函式 矩陣 幾乎在日常的生活中與自己沒有什麼交集。最近這個週末我在實驗室裡又將這本書重新閱讀了一筆,才發現數學原...
《數學之美》讀後感
近日拜讀了吳軍博士的 數學之美 感觸很深。對於我個人來說,這本書給我的最大驚喜就是吳軍博士將數學理論與他在實際工業界中的作用聯絡起來,看過我之前一些博文的可能發現,我自己最近在學習機器學習,但學習機器學習有個問題就是理論高深,枯燥,而且在學習的過程中比較難以落地,不知道自己學習的東西究竟在 發揮作用...