自然語言處理 nltk庫的安裝使用

2021-08-01 13:02:04 字數 686 閱讀 1431

nltk(natural language toolkit)庫簡介

nltk是乙個開源的專案,包含:python模組,資料集和教程,用於nlp的研究和開發

nltk由steven bird和edward loper在賓夕法尼亞大學計算機和資訊科學系開發。

nltk包括圖形演示和示例資料。其提供的教程解釋了工具包支援的語言處理任務背後的基本概念

nltk的安裝

1. 安裝nltk

pip install nltk
2. 安裝nltk_data

nltk的基本使用

在python控制台下輸入

可以看到書籍的節點

輸入節點名可以返回書籍資訊

搜尋文字

節點名.concordance(要搜尋的文字)

比如說 text2.concordance('why')

搜尋近義詞

text2.similar('why')

更多請參照nltk的文件

python自然語言處理 NLTK安裝

書籍中的版本是python2和nltk2,我使用的版本是python3.6和nltk3.3 首先,cmd視窗下輸入 pip install nltkpython下輸入以下命令,匯入nltk的資料模組 from nltk.book import 無論什麼時候想要找到這些文字,只需要再python提示符...

python自然語言處理(一)NLTK初步使用

nltk是python很強大的第三方庫,可以很方便的完成很多自然語言處理 nlp 的任務,包括分詞 詞性標註 命名實體識別 ner 及句法分析。一 nltk安裝教程 成功安裝後,測試。輸入下邊的語句就可以 from nltk.corpus import brown brown words the f...

自然語言處理 nltk 語料庫

語料庫可以從wordnet內建語料庫匯入,也可以從外界匯入 內建語料庫列表可以在nltk官網查詢 from nltk.corpus import reuters 路透社語料庫查詢語料庫內容,可以呼叫物件的fileids 函式,該函式得到檔案及其相對路徑 files reuters.fileids p...