基於情感詞典的情感打分

2021-09-07 11:29:36 字數 1173 閱讀 9246

原理我就不講了,請移步下面這篇**,包括情感詞典的構建(各位讀者可以根據自己的需求稍作簡化),以及打分策略(程式對原**稍有改動)。

本文採用的方法如下: 

首先對單條微博進行文字預處理,並以標點符號為分割標誌,將單條微博分割為n個句子,提取每個句子中的情感詞 。以下兩步的處理均以分句為處理單位。

第二步在情感詞表中尋找情感詞,以每個情感詞為基準,向前依次尋找程度副詞、否定詞,並作相應分值計算。隨後對分句中每個情感詞的得分作求和運算。

第三步判斷該句是否為感嘆句,是否為反問句,以及是否存在表情符號。如果是,則分句在原有分值的基礎上加上或減去對應的權值。

最後對該條微博的所有分句的分值進行累加,獲得該條微博的最終得分。

**如下:

首先檔案結構圖如下: 

其中,degree_dict為程度詞典,其中每個檔案為不同的權值。 

emotion_dict為情感詞典,包括了積極情感詞和消極情感詞以及停用詞。

檔案一:文字預處理 textprocess.py 

在裡面封裝了一些文字預處理的函式,方便呼叫。

# -*- coding: utf-8 -*-

__author__ = 'bai chenjia'

import jieba

檔案二:情感打分 dict_main.py 

其中待處理資料放在chinese_weibo.txt中,讀者可以自行更改檔案目錄,該檔案中的資料格式如下圖:

即用每一行代表一條語句,我們對每條語句進**感分析,進行打分

# -*- coding: utf-8 -*-

__author__ = 'bai chenjia'

import text_process as tp

實體詞典 情感詞典 基於詞典的情感分析 簡單例項

import re import jieba pip install jieba 0.39 class dictbasedsentanal def init self self.root dir dict self.sent dict self.read dict self.root dir bos...

實體詞典 情感詞典 (全)情感詞情感詞典大全

例項簡介 全 包括知網hownet情感詞典,台灣大學ntusd簡體中文情感詞典,情感詞彙本體,情感詞典及其分類,清華大學李軍中文褒貶義詞典,漢語情感詞極值表,否定詞典,褒貶詞及其近義詞 例項截圖 核心 sentimentanalysisdic sentimentanalysisdic 知網howne...

情感分析思想(基於各種詞典)

之前在實習時,teamleader想利用情感分析實現 公司績效考核 問題,即從boss對員工的評語中判斷該員工該月的績效值,屬情感分析領域。當時使用最簡單的基於情感詞典的方法解決,借鑑了這篇文章,在此基礎上對其進行修改,先講思路描述如下。注 情感詞典內包含詞語以及對應的情感值 停用詞典只包含停用詞語...