nltk是構建python程式以使用人類語言資料的領先平台。它為50多種語料庫和詞彙資源(如wordnet)提供了易於使用的介面,還提供了一套用於分類,標記化,詞幹化,標記,解析和語義推理的文字處理庫。nltk是python上著名的⾃然語⾔處理庫 ⾃帶語料庫,具有詞性分類庫 ⾃帶分類,分詞,等等功能。nltk被稱為「使用python進行教學和計算語言學工作的絕佳工具」,以及「用自然語言進行遊戲的神奇圖書館」。
這裡有乙個還不錯的官方的書籍: ,基於python 3 and nltk 3的,這裡有乙個中文版的介紹:
這本書第一版是基於python2的,以後有機會做一做介紹和整理性的文字,這本書第二版好像也是有中文版,但是第二版的中文版暫時沒有乙個完整的,如果看到的朋友可以介紹一下。
當前第二版的中文版還是處於網友們協作翻譯的階段:有找到出版了的同學求介紹,或者加入一起幫忙修訂
然後目前找到的最完整已經出版了的中文版是這個:商品鏈結 (這個圖看起來就很像是乙個鹹魚是吧哈哈哈)
這個是講解安裝和初步的使用的:
在 nltk 中使用 stanford nlp 工具包
自然語言處理 nltk 語料庫
語料庫可以從wordnet內建語料庫匯入,也可以從外界匯入 內建語料庫列表可以在nltk官網查詢 from nltk.corpus import reuters 路透社語料庫查詢語料庫內容,可以呼叫物件的fileids 函式,該函式得到檔案及其相對路徑 files reuters.fileids p...
python自然語言處理 NLTK安裝
書籍中的版本是python2和nltk2,我使用的版本是python3.6和nltk3.3 首先,cmd視窗下輸入 pip install nltkpython下輸入以下命令,匯入nltk的資料模組 from nltk.book import 無論什麼時候想要找到這些文字,只需要再python提示符...
自然語言處理 nltk庫的安裝使用
nltk natural language toolkit 庫簡介 nltk是乙個開源的專案,包含 python模組,資料集和教程,用於nlp的研究和開發 nltk由steven bird和edward loper在賓夕法尼亞大學計算機和資訊科學系開發。nltk包括圖形演示和示例資料。其提供的教程解...