python自然語言處理（一）

1.從nltk的book模組載入所有東西

>>>fromnltk.book import *

2.詞語索引檢視。顯示乙個指定單詞的每一次出現，連同上下文一起顯示。

>>>text1.concordance(『monstrous』)

3.通過索引看到monstrous上下文中有the_pictures和the_size,查詢哪些詞出現在相似上下文，可以在被查詢文字名後加similar，然後括號中插入相關詞

>>>text1.similar(『monstrous』)

4.函式common_contexts允許研究兩個或兩個以上的詞共同的上下文，如monstrous和very。使用函式時必須永方括號和圓括號把詞括起來，中間用逗號分開。

>>>text2.common_contexts([『monstrous』,『very』])

5.使用離散圖顯示詞在文字中位置，每一豎線代表乙個單詞，每一行代表整個文字

>>>text4.dispersion_plot([『citizens』,』democracy』,』freedom』.』duties』,』america』])

6.使用函式len獲取文字中出現的詞和標點符號為單位算出的長度

>>>len(text3)

7.set(text3)得到集合，無重複元素

將其按順序列出

>>>sorted(set(text3))

計算其長度

>>>len(set(text3))

8.計算每個詞平均使用次數

>>>len(text3)/len(set(text3))

9.計數乙個詞在文字出現的次數

>>>text3.count(『smote』)

計算乙個特定詞在文字中佔據百分比

>>>100*text4.count(『a』)/len(text4)

10.可以定義函式來避免重複計算

>>>def lexical_diversity(text):

... return len(text)/len(set(text))

>>>def percentage(count,total):

... return 100*count/total

可如下呼叫函式

>>>lexical_diversity(text5)

7.420046158918563

>>>percentage(text4.count('a'),len(text4))

1.4643016433938312

《Python自然語言處理》

python自然語言處理基本資訊出版社人民郵電出版社 isbn 9787115333681 出版日期 2014 年6月開本 16開頁碼 508 版次 1 1 所屬分類計算機軟體與程式設計 python 更多關於 python自然語言處理內容簡介書籍計算機書籍自然語言處理 natu...

自然語言處理

自然語言處理主要步驟包括 2.詞法分析對於英文，有詞頭詞根詞尾的拆分，名詞動詞形容詞副詞介詞的定性，多種詞意的選擇。比如diamond，有菱形棒球場鑽石3個含義，要根據應用選擇正確的意思。3.語法分析通過語法樹或其他演算法，分析主語謂語賓語定語狀語補語等句子元素。4.語...

自然語言處理

前言自然語言處理 natural language processing 是計算科學領域與人工智慧領域中的乙個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理是一門融語言學電腦科學數學於一體的科學。因此，這一領域的研究將涉及自然語言，即人們日常使用的語言...

python自然語言處理（一）

《Python自然語言處理》

自然語言處理

自然語言處理

相關推薦