情感分析 詞典建立

2022-05-08 05:06:13 字數 791 閱讀 7425

詞典包括情感詞典、程度詞典、否定詞典和連詞詞典,其中情感詞典最為重要,程度詞典和否定詞典用於識別修飾情感詞語的成分,連詞詞典用於識別句際關係.

以情感詞彙本體為主要資源,結合hownet情感分析用中文詞集、中文褒貶義詞典 和學生褒貶義詞,經過整合、去重、轉換和補充得到含有28567個詞語的情感詞典,每個詞語標註詞性、極性(1為褒義詞、-1為貶義詞、0為中性詞)、強度(分為5檔,5表示強度最大,1表示強度最小)等資訊.結合詞語的極性以及強度可以度量詞語的情感值.

根據hownet中文程度級別詞語整理程度詞典,共計140個程度詞語,如「很」、「非常」,用符號deg 表示,為每個程度詞語設定權重weight(deg).根據hownet將表達「極其、最」意義的權重設為5、

「很」意義的權重設為4、「較」意義的權重設為3、「稍微、一點」意義的權重設為2.

hownet中的否定詞語含有「negation」義項,根據該義項找到否定詞語,再新增一些常用的否定詞語,如網路用語「木有」,共計65個.否定詞語用符號neg 表示,若將否定詞語看作特殊的程度詞語,有degree(neg)=-1.

句子之間的主從關係包括總結(或結果)、讓步、轉折、假設、目的和條件等,會體現句子情感表達的側重.從句子情感而言,總結或轉折子句的情感最為重要,讓步子句的情感相對不重要,而假設、目的和條件子句一般認為不體現情感.從語料中篩選出60個連詞並標註主從關係,如「但是」表轉折.

摘自:否定句的情感不確定性度量及分類

實體詞典 情感詞典 基於詞典的情感分析 簡單例項

import re import jieba pip install jieba 0.39 class dictbasedsentanal def init self self.root dir dict self.sent dict self.read dict self.root dir bos...

實體詞典 情感詞典 (全)情感詞情感詞典大全

例項簡介 全 包括知網hownet情感詞典,台灣大學ntusd簡體中文情感詞典,情感詞彙本體,情感詞典及其分類,清華大學李軍中文褒貶義詞典,漢語情感詞極值表,否定詞典,褒貶詞及其近義詞 例項截圖 核心 sentimentanalysisdic sentimentanalysisdic 知網howne...

實體詞典 情感詞典 文字情感分析的學習筆記

對文字的觀點 喜好 情感傾向進行分類 1 按情感傾向 極性劃分 比如分為正面 負面 中性情感。2 按情感程度深淺劃分 比如分為熱愛 喜歡 一般 不喜歡 厭惡。3 按情感類別來劃分 比如新聞分類。通過分析研究物件的情感分布,可了解輿情,輔助商業 決策。2.1,文件級 為觀點型文件標記整體的情感傾向 極...