snownlp是乙個python寫的類庫,可以方便的處理中文文字內容,是受到了textblob的啟發而寫的,由於現在大部分的自然語言處理庫基本都是針對英文的,於是寫了乙個方便處理中文的類庫,並且和textblob不同的是,這裡沒有用nltk,所有的演算法都是自己實現的,並且自帶了一些訓練好的字典。
計算情感值的示例如下:
from snownlp import snownlp
s = snownlp(u'這個東西真心很讚')
s.words # [u'這個', u'東西', u'真心',
# u'很', u'贊']
s.tags # [(u'這個', u'r'), (u'東西', u'n'),
# (u'真心', u'd'), (u'很', u'd'),
# (u'贊', u'vg')]
s.sentiments # 0.9769663402895832 positive的概率
snownlp: simplified chinese text processing
snownlp是乙個python寫的類庫,可以方便的處理中文文字內容,是受到了textblob的啟發而寫的,由於現在大部分的自然語言處理庫基本都是針對英文的,於是寫了乙個方便處理中文的類庫,並且和textblob不同的是,這裡沒有用nltk,所有的演算法都是自己實現的,並且自帶了一些訓練好的字典。注意本程式都是處理的unicode編碼,所以使用時請自行decode成unicode。
features
中文分詞(character-based generative model)(todo: 新演算法導致字典過大,現在暫時去掉了字典但是第一次import時間稍微長一點)
詞性標準(tnt 3-gram 隱馬)
情感分析
文字分類(***** bayes)
轉換成拼音
繁體轉簡體
提取文字摘要(textrank演算法)
tf,idf
tokenization(分割成句子)
文字相似(bm25)
支援python3(感謝erning)
get it now
$ pip install snownlp
知網發布「情感分析用詞語集(beta版)
python 文字挖掘:使用情感詞典進**感分析(情感詞典 )
python 文字挖掘:使用情感詞典進**感分析(演算法及程式設計)
python元類的使用 python使用元類
原文 type 動態語言和靜態語言最大的不同,就是函式和類的定義,不是編譯時定義的,而是執行時動態建立的。比方說我們要定義乙個hello的class,就寫乙個hello.py模組 當python直譯器載入hello模組時,就會依次執行該模組的所有語句,執行結果就是動態建立出乙個hello的class...
python的應用環境 python的使用環境總結
python在linux上執行,使用的是vim,每次都是敲四個空格進行縮排,真尼瑪的蛋疼,書本果然是個好東西,從而根據書本python高階程式設計中的設定配置而來 1 進行自動補全的指令碼 root python cat pythonstartup python startup file impor...
Python時間的使用
usr bin python coding utf 8 import time import datetime 系統時間戳 print time.time 1450682521.0920722 localtime返回的是當前時區的值 print time.localtime time.struct ...