import re
import jieba # pip install jieba==0.39
class dictbasedsentanal:
def __init__(self):
self.__root_dir = 'dict/'
self.__sent_dict__ = self.__read_dict(self.__root_dir+'bosonnlp_sentiment_score.txt')
def analyse(self, sentence):
score = 0.0
for words in jieba.cut(sentence):
score += self.__sent_dict__.get(words, 0)
return score
@staticmethod
def __read_dict(path, encoding='utf-8'):
sent_dict = {}
with open(path, encoding=encoding) as input_file:
for line in input_file:
array = re.split('\s+', line.strip())
if len(array) == 2:
sent_dict[array[0]] = float(array[1])
return sent_dict
if __name__ == '__main__':
sentanal = dictbasedsentanal()
print('情感得分\t' + '%.2f' % sentanal.analyse('這個時候反應太慢了!'))
print('情感得分\t' + '%.2f' % sentanal.analyse('這本書真好,內容特別精彩。'))
輸出結果:
情感得分 -1.56
情感得分 7.11
從上面的例子,可以看出:「這個時候反應太慢了!」判斷為負向情感傾向,「這本書真好,內容特別精彩。」判斷為正向情感傾向,這與我們的認知一致。雖然基於詞典的情感分析方法比較簡單,但是在實際中也證明有價值。以上實現還比較簡答,還有很大的改進空間。
實體詞典 情感詞典 (全)情感詞情感詞典大全
例項簡介 全 包括知網hownet情感詞典,台灣大學ntusd簡體中文情感詞典,情感詞彙本體,情感詞典及其分類,清華大學李軍中文褒貶義詞典,漢語情感詞極值表,否定詞典,褒貶詞及其近義詞 例項截圖 核心 sentimentanalysisdic sentimentanalysisdic 知網howne...
實體詞典 情感詞典 文字情感分析的學習筆記
對文字的觀點 喜好 情感傾向進行分類 1 按情感傾向 極性劃分 比如分為正面 負面 中性情感。2 按情感程度深淺劃分 比如分為熱愛 喜歡 一般 不喜歡 厭惡。3 按情感類別來劃分 比如新聞分類。通過分析研究物件的情感分布,可了解輿情,輔助商業 決策。2.1,文件級 為觀點型文件標記整體的情感傾向 極...
基於情感詞典的情感打分
原理我就不講了,請移步下面這篇 包括情感詞典的構建 各位讀者可以根據自己的需求稍作簡化 以及打分策略 程式對原 稍有改動 本文採用的方法如下 首先對單條微博進行文字預處理,並以標點符號為分割標誌,將單條微博分割為n個句子,提取每個句子中的情感詞 以下兩步的處理均以分句為處理單位。第二步在情感詞表中尋...