通訊模型:
資訊源編碼發出資訊→通道傳遞資訊→接受者解碼接受資訊
語言和詞彙增多→文字產生(基於高效記錄資訊的需求)→概念開始概括和歸類
概念的聚類原理上與自然語言的處理或者機器學習的聚類有很大的相似性。
一詞多義→產生歧義→根據上下文消除歧義
羅塞塔石碑的啟示:
資訊的冗餘是資訊保安的保障;雙語或者多語的對照語料對翻譯至關重要,是從事機器翻譯研究的基礎。
使用十進位制的原因:人通過掰手指頭計數(瑪雅文明採取二十進位制,乙個世紀為四百年)。當數量增多十個手指不夠用時就發明了進製。
古印度人發明了阿拉伯數字,標誌著數字與文字的分離。
文字和語言背後的數學:
從象形文本進化到了拼音文字,從物體的外形進化到了抽象的概念,就是採用了對資訊的編碼;
常用字短筆畫少,生僻字長筆畫多,符合最短編碼原理
發明紙張之前,因書寫文字不易,古文都非常簡潔,但也非常難懂,而說話採用的和現代的白話大致相同;在通訊時,如果通道較寬,資訊不必壓縮可以直接傳遞,如果通道較窄,資訊在傳遞前需要盡可能的壓縮,然後在接收端解壓縮。
古猶太人抄寫聖經,為了防止發生錯誤,發明了一種類似於現在的校驗碼的方法。他們把每乙個希伯來字母對應乙個數字,每行每列數字加起來得到乙個校驗碼,之後在抄寫完成後與原文的的校驗碼進行對照,如果對不上說明錯誤的一行或一列至少有乙個錯誤存在,就可以很快找出出錯的地方。
從字母到詞的構詞法是詞的編碼規則,語法則是語言的編碼和解碼規則。詞可以被認為是有限而且封閉的集合,語言則是無限開放的集合,所以前者可以有完備的編譯碼規則,而後者則不具備這個特性。
總結:
數學之美 第一章 文字和語言vs數字和資訊
早期人類交流舉例,用某種特定的聲音表示 那裡有只熊 同伴 呀呀 回應兩聲。早期人類的交流方式與現在的通訊中的資訊傳播模型相同。隨著文明的進步,資訊量增加了,但是因為沒有人能夠記住大量的文字,因此出現了概念的 聚類 比如,在中國的象形文本中,日 本意是太陽,同時又指的是一天 在古代埃及的象形文本中,讀...
《數學之美》 第一章 個人筆記
最近在讀 數學之美 這本書,做一下個人筆記。看的是pdf,看完後會買一本的哦!版權意識還是有的。1 資訊 通訊的原理就是這三個步驟,本質上是一致的,只不過今天的實現形態發生了變化。更技術,更高大上了。2 文字和數字 語言的越來越豐富,詞彙的越來越多,人無法記住所有產生的詞彙,所以文字就此誕生,是為了...
數學之美讀書筆記第一章
通訊的原理和資訊傳播的模型 原理 資訊被編碼,再被解碼的過程。資訊傳播的模型 傳播人 資訊 編碼資訊 通道 聲音介質,雙絞線介質等 解碼資訊 接受者。資訊源的編碼和最短編碼 常用的資訊被編碼為更加簡單或者書寫更加少來實現最短編碼。不常用的資訊通常筆畫較多,或者更加複雜。解碼的規則和語法 編碼後的語言...