《數學之美》 讀後感

2021-10-02 09:14:48 字數 1170 閱讀 9208

後記參考鏈結

一直以來都不喜歡看書,比較偏愛數學,覺得只要知道思路不用記太多長篇大論的東西。本科學了四年的數學與應用數學,我從不懷疑數學的價值,但是天天面對複雜的定理和證明,一度時間讓我很懷疑數學的實用性,畢竟很多人並不需要知道每一步是怎末推導的,只需要把對應的公式記住就完事了。

大三決心考研的時候,便當了逃兵,轉到了統計,考研複試是我第一次感受到本科四年的數學知識在我身上的實際體現,複試筆試的題目好多都是本科只有數學專業才學的特別難的概率論和數理統計的課後習題,慶幸自己沒有偷懶,所有的習題都自己做了一遍。隨著接觸的統計和自然語言處理的知識越來越多,我越來越感受到數學的實用性,那些複雜的推導和證明可以在實際中更快更清晰的解決更多問題。

在朋友和老師的推薦下,便讀了吳軍老師的數學之美,更是加深了我對數學的認知,真正感受到了從統計學到天文學,數學不僅無處不在,而且無法替代。本文主要整理數學之美裡面一些比較實際的問題,作為自己讀書後的總結。

在英文中詞是最小的語義單位,用空格自動隔開。但是在中文中,字是最小的語義單位,不僅不同的字意義不同,而且相同的字也可能存在不同的意義。為了解決一字多義問題,在對中文自然語言處理問題進行分析前,需要進行分詞。在不同的語境下,需要不同的分詞方式,如何衡量分詞效果的好壞成為了乙個重要的問題。常用的標準主要有:

利用新聞之間的相似性,可以將相似的新聞進行聚類。

但是當資料量比較大時,計算起來壓力就比較大。

***利用偽隨機數生成器,生成隨機數,生成的次數越多,重複的概率就越高。 但是將集合對映到128位的二進位制數,指紋重複的概率特別低,一千八百億億次 才有可能重複一次。***

輸入漢字的時間 = 擊鍵的次數 * 漢字編碼的平均長度

漢字編碼主要包括對拼音的編碼和消除歧義性的編碼

早期利用聲韻母的雙拼輸入法,雖然節省了編碼長度,但是輸入漢字的時間並沒有減慢。

目前廣泛使用的是全拼輸入法,雖然漢字編碼較長,但是使用者的輸入速度並不慢。

數學之美介紹的東西遠遠不止這些,還有數學在天文學和語音識別等領域中的應用,另外,書中還介紹了統計語言模型、隱馬爾可夫、貝葉斯網路、em演算法、圖論等在自然語言處理中的應用,如果對自然語言處理感興趣,強烈建議讀一下吳軍老師的數學之美。

雜湊表儲存效率50%的原因

吳軍,《數學之美》

數學之美讀後感

統計語言模型 馬爾可夫鏈,模型訓練,零概率平滑 隱馬爾可夫鏈 概率訓練,鮑姆 韋爾奇演算法 資訊度量和作用 資訊熵,互資訊,聯合概率分布 相對熵 簡單之美 布林袋鼠和搜尋引擎的索引 文獻搜尋 圖論和網路爬蟲 最短路徑,網路爬蟲,雜湊表,工程要點 dfs,bfs,頁面分析和url提取,url表 pag...

《數學之美》讀後感

暑假的時候導師給我推薦了一本 數學之美 作為語音識別入門性的讀物。實話說來從小學到高中再到大學我們一直在學習數學,除了一些基本的加減乘除可以在生活中直接用到。其他的例如 倒數 微積分 各種函式 矩陣 幾乎在日常的生活中與自己沒有什麼交集。最近這個週末我在實驗室裡又將這本書重新閱讀了一筆,才發現數學原...

《數學之美》讀後感

近日拜讀了吳軍博士的 數學之美 感觸很深。對於我個人來說,這本書給我的最大驚喜就是吳軍博士將數學理論與他在實際工業界中的作用聯絡起來,看過我之前一些博文的可能發現,我自己最近在學習機器學習,但學習機器學習有個問題就是理論高深,枯燥,而且在學習的過程中比較難以落地,不知道自己學習的東西究竟在 發揮作用...