Python自然語言處理(NLP)工具小結

2021-09-13 20:52:02 字數 1352 閱讀 4024

python 的幾個自然語言處理工具

自然語言處理(natural language processing,簡稱nlp)是人工智慧的乙個子域。自然語言處理的應用包括機器翻譯、情感分析、智慧型問答、資訊提取、語言輸入、**分析、知識圖譜等方面。也是深度學習的乙個分支。首先介紹一下python的自然語言處理工具包:

1.nltk工具包

nltk 在用 python 處理自然語言的工具中處於領先的地位。它提供了 wordnet 這種方便處理詞彙資源的介面,還有分類、分詞、除莖、標註、語法分析、語義推理等類庫。

2.jieba工具包

3.pattern工具包

pattern 工具包包括詞性標註工具(part-of-speech tagger),n元搜尋(n-gram search),情感分析(sentiment analysis),wordnet。同時也支援機器學習的向量空間模型,聚類和支援向量機。

4.textblob

textblob 是乙個處理文字資料的 python 庫。提供了一些簡單的api解決一些自然語言處理的任務,例如詞性標註、名詞短語抽取、情感分析、分類、翻譯等等。

5.gensim

gensim 提供了對大型語料庫的主題建模、檔案索引、相似度檢索的功能。它可以處理大於ram記憶體的資料,作者說它是「實現無干預從純文字語義建模的最強大、最高效、最無障礙的軟體」。

7.spacy

spacy是乙個商業的開源軟體,結合python和cython,自然語言處理能力達到了工業強度。是領域內速度最快、最先進的自然語言處理工具。

8.polyglot

polyglot 支援對海量文字和多語言的處理。它支援對165種語言的分詞,對196種語言的辨識,40種語言的專有名詞識別,16種語言的詞性標註,136種語言的情感分析,137種語言的嵌入,135種語言的形態分析,以及69中語言的翻譯。

9.montylingua(英文)

montylingua 是乙個自由的、訓練有素的、端到端的英文處理工具。輸入原始英文文字到 montylingua ,就會得到這段文字的語**釋。適合用來進行資訊檢索和提取,問題處理,回答問題等任務。從英文文字中,它能提取出主動賓元組,形容詞、名詞和動詞短語,人名、地名、事件,日期和時間等語義資訊。

10.bllip parser

bllip parser(也叫做charniak-johnson parser)是乙個整合了產生成分分析和最大熵排序的統計自然語言工具。包括 命令列 和 python介面 。

11.quepy

quepy是乙個python框架,提供將自然語言轉換成為資料庫查詢語言,可以輕鬆地實現不同型別的自然語言和資料庫查詢語言的轉化。所以,通過quepy,僅僅修改幾行**,就可以實現你自己的自然語言查詢資料庫系統。 

github:

NLP自然語言處理

第1部分自然語言處理入門 1.1自然語言處理入門.mp4 第2部分hmm和crf 1.1crf模型簡介.mp4 1.1hmm模型介紹.mp4 1.2文字處理的基本方法 part1.mp4 2.1新聞主題分類任務 第4步 part2.mp4 第43部分rnn 1.1rnn模型小結.mp4 1.1rnn...

NLP自然語言處理

老實來講這課我一頭霧水滿腦袋問號 import numpy as np from collections import counter counttime 0 def seperate filename totalnum 0 郵件的總數 global counttime i 0 file open ...

NLP自然語言處理相關

近期需要學習一些命名實體識別的知識,記錄一下,以便以後複習 個人理解 目前的理解是,命名實體識別 ner 是自然語言處理 nlp 的乙個階段,可應用於機器翻譯 摘要形成 資訊檢索等等,個人認為,自然語言處理是一門很複雜的跨學科技術,其難點在於人類是富有思維的,人的語言寄託人的思想,因此很難準確處理。...