對文字的觀點、喜好、情感傾向進行分類:
(1)按情感傾向 / 極性劃分;比如分為正面、負面、中性情感。
(2)按情感程度深淺劃分;比如分為熱愛、喜歡、一般、不喜歡、厭惡。
(3)按情感類別來劃分;比如新聞分類。
通過分析研究物件的情感分布,可了解輿情,輔助商業**、決策。
2.1,文件級
為觀點型文件標記整體的情感傾向/極性
2.2,語句級
對文件內單獨的語句,標記其主觀分類 / 極性分類
通常會把句子分為積極、中立或消極3類
2.3,實體特徵層面 aspect level
判斷語句在實體特徵層面的情感傾向
需要找到實體的特徵 / 屬性、情感詞
3.1,基於情感詞典
根據已構建的情感詞典,對待分析文字進行文字處理,抽取情感詞,計算該文字的情感傾向。
分類效果取決於情感詞典的完善性。
一般流程
(1)構建情感詞典
情感詞程度詞(非必須)
否定詞:反轉情感傾向
確定情感詞、程度詞的評分機制,以及否定詞的反轉機制
(2)對文字進行分詞,匹配情感詞典
(3)根據評分和反轉機制,通過合適的演算法,計算出文字的情感得分
3.2,基於機器學習
通過演算法模型獲取特徵詞,形成文字和詞的矩陣,再利用機器學習/深度學習等方法進行分。
分類效果取決於訓練文字的選擇以及正確的情感標註。
一般流程
(1)選一部分語料,標記出情感分類
(2)對語料進行分詞,通過合適的模型演算法轉換成詞向量,獲取特徵詞
(3)搭建模型,對資料進行訓練和測試,調整穩定後形成分類器
(4)用分類器對新語料進行分類
多模態情感分析
把文字+語音+影象作為輸入,都轉成空間向量做分析。
實體詞典 情感詞典 (全)情感詞情感詞典大全
例項簡介 全 包括知網hownet情感詞典,台灣大學ntusd簡體中文情感詞典,情感詞彙本體,情感詞典及其分類,清華大學李軍中文褒貶義詞典,漢語情感詞極值表,否定詞典,褒貶詞及其近義詞 例項截圖 核心 sentimentanalysisdic sentimentanalysisdic 知網howne...
實體詞典 情感詞典 基於詞典的情感分析 簡單例項
import re import jieba pip install jieba 0.39 class dictbasedsentanal def init self self.root dir dict self.sent dict self.read dict self.root dir bos...
情感分析 詞典建立
詞典包括情感詞典 程度詞典 否定詞典和連詞詞典,其中情感詞典最為重要,程度詞典和否定詞典用於識別修飾情感詞語的成分,連詞詞典用於識別句際關係 以情感詞彙本體為主要資源,結合 情感分析用中文詞集 中文褒貶義詞典 和學生褒貶義詞,經過整合 去重 轉換和補充得到含有 個詞語的情感詞典,每個詞語標註詞性 極...