觀點是乙個廣義的概念,包括了情感、評估、評價、態度,以及其他相關資訊,包括觀點持有者和觀點評價物件。
觀點四元組表示。觀點的結構化表示一般有四元組:
( g,
s,h,
t)
(g, s, h, t)
(g,s,h
,t)其中,g
gg表示觀點評價物件或者評價物件的屬性,s
ss表示情感詞,h
hh是觀點持有者,t
tt常規型觀點。常規型觀點在文獻中常簡稱為觀點,主要包括以下兩類:
比較型觀點。比較型觀點是對兩個或更多實體之間的相同或不同點進行比較,表達了觀點持有者對其中乙個的偏好。比如「可口可樂比百事可樂好喝」。
第一人稱觀點。表達了乙個人或團體對乙個實體的態度。
非第一人稱觀點。由乙個人轉述他人的觀點,即相信他人會持有某種觀點。
元觀點。元觀點是對觀點的觀點。比如:「我對中國足球在比賽中失分覺得很傷心。」
情感物件又稱為觀點評價物件,是觀點所評價的實體、實體的一部分或實體的乙個屬性。
乙個實體e
ee可以被層次化地分解和表示,可以是乙個產品、服務、主題、個人、組織、事件。可以用乙個對e:(
t,w)
e:(t,w)
e:(t,w
)來描述,其中t
tt是乙個層次關係,而w
ww是e
ee的屬性集合。在很多文獻中,實體也被稱為物件,實體屬性也被稱為特徵。
觀點五元組表示。當實體採用實體對的形式表示時,此時觀點的表示可以表達為五元組:
( e,
a,s,
h,t)
(e, a, s, h, t)
(e,a,s
,h,t
)五元組的表示法也是工業中經常採用的儲存形式。當觀點針對整個實體進行評價時,此時屬性用乙個特定的值「general」表示。
情感是觀點中所蘊含的感受、態度、評價或情緒。通常情感由乙個三元組表示:
( y,
o,i)
(y, o, i)
(y,o,i
)其中,y
yy是情感型別,o
oo是情感的傾向,i
ii是情感的強度。
情感型別有基於語言學、心理學和消費者調研等劃分方法,一般用的比較多是消費者調研,它將情感分為兩種型別:理性情感和感性情感。
理性情感**於理性推理、切實的信念和實用主義的態度,不包含任何主觀的情緒。比如「手機的音質很清晰」。
感性情感則存在於人們深度的心理狀態之中,來自於對實體的不可觸及切情緒化的反應。比如「我對他們的服務人員很生氣」。
情感傾向可以是正面、負面或者中立的。
情感強度表示情感的不同強度,一般有三種方法,一種是對情感詞劃分強度,比如good和excellent表達對情感強度就不同;另一種是採用程度副詞,比如非常、很等。第三種是採用情感評分,一般採用5檔評分,評分規則如下:
情感分析的目標就是給定乙個包含觀點資訊的文件d
dd,抽取出d
dd中所有觀點五元組,抽取完成後,需要對抽取楚的實體和屬性進行分類,這裡涉及幾個概念:
每個實體或者實體類別都應當在乙個特定應用中有唯一的名稱,把實體表達聚合或組合為實體類別的過程叫作實體消解或者實體聚類,同樣地,把不同具有相同語義但不同文字的屬性表達組合為乙個屬性類別的過程叫做屬性消解或者屬性聚類。
基於屬性的觀點摘要:對於實體e
ee的基於屬性的觀點摘要結果具有如下形式:
屬性1:
其中,general表示實體本身。
相關基礎概念
robots協議 每個 都會設定自己的robots協議,來明示搜尋引擎,哪些內容是願意和允許被搜尋引擎收錄的,哪些則不允許。而搜尋引擎則會按照robots協議給與自己的許可權來進行抓取。robots協議已經成為所有搜尋引擎必須遵守的國際慣例。例 的robots.txt檢視位址為 反反爬策略 讓爬蟲程...
需求分析和概念原型 文字情感分析系統
本文基於本人的工程實踐專案 文字情感分析,對其進行相應的用例建模和業務領域建模,以及資料建模,最終形成概念原型。該項目的重點是對情感相關資訊進行分類,旨在將文字情感分為積極 中立和消極三種類別或者更細緻的情感類。需求就是對使用者期望的軟體行為的表述 獲取需求就是需求分析師通過關注使用者的期望和需要,...
音訊分析相關概念
現在假設某段樂曲有30秒,8 bit取樣,頻率為44100hz,雙聲道,pcm編碼,則樣本總數為2646000個。2 特徵 音量 音高 音色,幀長 幀重疊 幀距 幀率 如上所述,可通過繪製波形的方式研究 特徵。從圖2的波形上看,具有如下特徵 1 長期特徵 一段樂曲 波形變化大,週期無規律 2 短期特...