中文情感分析語料庫
中文情感分析的語料庫非常少,這五個中文語料庫是我在網上的蒐集的。
url:
資料集2:2023年ccf自然語言處理與中文計算會議:中文微博情感分析測評資料
url:
條微博,共約 20000 條微博。資料採用xml格式,已經預先切分好句子。每條句子的所有標註資訊都包含在元素的屬性中。其中opinionated表示是否觀點句,polarity表示句子情感傾向。
資料集3:中文情感挖掘語料-chnsenticorp
url :
說明:語料庫涉及3個領域:酒店、電腦(筆記本)與書籍
去重後語料:
資料集4:豆瓣網影評情感測試語料
url:
資料集5:semeval-2016
url:
訓練資料
測試資料
句子級數
句子級數
移動手機
1406330
1405784
數碼產品
603191
602556
中文情感分析語料庫
原文 中文情感分析的語料庫非常少,這五個中文語料庫是我在網上的蒐集的。url 資料集2 2012年ccf自然語言處理與中文計算會議 中文微博情感分析測評資料 url 條微博,共約 20000 條微博。資料採用xml格式,已經預先切分好句子。每條句子的所有標註資訊都包含在元素的屬性中。其中opinio...
用BRAT進行中文情感分析語料標註
1.背景 情感分析是nlp中的一大分支,無論在學術界還是工業界都有廣泛的研究,在semeval語義分析會議中有單獨的情感分析任務分支,其中最難的乙個任務叫做absa aspect based sentiment analysis,面向方面的情感分析。舉例來說,就是對以下句子,新版本英雄的 很不錯,但...
python中文問答系統 基於語料庫的問答系統
將乙個問題及其答案 假設只有乙個 作為lucene中的乙個文件來考慮。lucene支援文件的字段檢視 因此在構建文件時,請將問題設為可搜尋字段。一旦檢索到給定查詢問題的排名靠前的問題,請使用document類的get方法返回答案。框架 自己填寫 index indexwriterconfig iwc...