使用Python的SnowNLP模組實現情感分析

2021-07-24 04:09:50 字數 1203 閱讀 2929

snownlp是乙個python寫的類庫,可以方便的處理中文文字內容,是受到了textblob的啟發而寫的,由於現在大部分的自然語言處理庫基本都是針對英文的,於是寫了乙個方便處理中文的類庫,並且和textblob不同的是,這裡沒有用nltk,所有的演算法都是自己實現的,並且自帶了一些訓練好的字典。

計算情感值的示例如下:

from snownlp import snownlp

s = snownlp(u'這個東西真心很讚')

s.words # [u'這個', u'東西', u'真心',

# u'很', u'贊']

s.tags # [(u'這個', u'r'), (u'東西', u'n'),

# (u'真心', u'd'), (u'很', u'd'),

# (u'贊', u'vg')]

s.sentiments # 0.9769663402895832 positive的概率

snownlp: simplified chinese text processing

snownlp是乙個python寫的類庫,可以方便的處理中文文字內容,是受到了textblob的啟發而寫的,由於現在大部分的自然語言處理庫基本都是針對英文的,於是寫了乙個方便處理中文的類庫,並且和textblob不同的是,這裡沒有用nltk,所有的演算法都是自己實現的,並且自帶了一些訓練好的字典。注意本程式都是處理的unicode編碼,所以使用時請自行decode成unicode。

features

中文分詞(character-based generative model)(todo: 新演算法導致字典過大,現在暫時去掉了字典但是第一次import時間稍微長一點)

詞性標準(tnt 3-gram 隱馬)

情感分析

文字分類(***** bayes)

轉換成拼音

繁體轉簡體

提取文字摘要(textrank演算法)

tf,idf

tokenization(分割成句子)

文字相似(bm25)

支援python3(感謝erning)

get it now

$ pip install snownlp

知網發布「情感分析用詞語集(beta版)

python 文字挖掘:使用情感詞典進**感分析(情感詞典 ) 

python 文字挖掘:使用情感詞典進**感分析(演算法及程式設計) 

python元類的使用 python使用元類

原文 type 動態語言和靜態語言最大的不同,就是函式和類的定義,不是編譯時定義的,而是執行時動態建立的。比方說我們要定義乙個hello的class,就寫乙個hello.py模組 當python直譯器載入hello模組時,就會依次執行該模組的所有語句,執行結果就是動態建立出乙個hello的class...

python的應用環境 python的使用環境總結

python在linux上執行,使用的是vim,每次都是敲四個空格進行縮排,真尼瑪的蛋疼,書本果然是個好東西,從而根據書本python高階程式設計中的設定配置而來 1 進行自動補全的指令碼 root python cat pythonstartup python startup file impor...

Python時間的使用

usr bin python coding utf 8 import time import datetime 系統時間戳 print time.time 1450682521.0920722 localtime返回的是當前時區的值 print time.localtime time.struct ...