【文字標註】文字標註工具brat的使用
2019常用nlp標註工具簡單介紹
nlp標註工具:
yedda:(2016)(python)(可以在windows上裝)
優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。
doccano:(2019)(可以在windows上裝)
支援命名實體識別,情感分類,機器翻譯任務,介面比較友好。
prodigy(2017):
實體標註、分類標註,情感標註,都是英文的,功能最全的。
chinese-annotator:(2017)
基於prodigy的中文標註工具
brat:(2010)
支援實體、關係、事件抽取的標註。可以標註情感。
優點在標註實體的同時可以進行關係標註,還可以實現二級標註。
iepy:
主要用來資訊抽取和關係抽取任務
deepdive:
主要用來關係抽取任務,17就停止更新了
小結: 選用brat是因為有現成的中文情感標註,還有brat有關係標註
選用doccano是它的頁面很友好,而且可新增的標籤數也比較多
選用yedda是它完全用python桌面開發且支援中文
選用prodigy是因為支援標註的功能最全
打標工具brat的安裝與使用
標註工具Brat安裝(本地)
由於研究方向需要對文字進行標註,物件為大量期刊文獻,手動標註肯定不太現實,於是找到了brat標註工具,雖然這玩意兒好像挺久沒更新了,只支援python2,但是只用來標註還是沒問題吧。所以,只能將就著裝本地版本了,不過還是建議先配置個apache,反正安裝簡單,防止其他不必要的錯誤,tar xzf b...
本地安裝brat標註平台
tar xzfbrat v1.3 crunchy frog tar gz三 進入子目錄中 cd brat v1.3 crunchy frog 四 輸入登入的賬號密碼以及郵箱 userpasswordemail五 安裝成功brat就可以執行了 python standalone pypython必須是...
開源NLP文字標註工具CatchingFire
做過nlp相關工作內容的小夥伴應該都知道標註資料才是最花時間的部分,因此乙個好用的標註工具來提高標註效率尤為重要。調研了多個開源工具後,發現現有大多數標註工具都只是簡單的標註功能,並沒有利用模型智慧型輔助標註。因此閒暇之餘開發了標註工具catchingfire 因為標註工具雖然看起來不重要,但是在n...