做過nlp相關工作內容的小夥伴應該都知道標註資料才是最花時間的部分,因此乙個好用的標註工具來提高標註效率尤為重要。
調研了多個開源工具後,發現現有大多數標註工具都只是簡單的標註功能,並沒有利用模型智慧型輔助標註。因此閒暇之餘開發了標註工具catchingfire(因為標註工具雖然看起來不重要,但是在nlp任務當中佔據極為重要的部分,catchingfire也就是星星之火可以燎原的意思)。
標註工具位址為
架構圖如下:
功能包括實體識別標註、文字分類標註、三元組抽取標註。支援規則、機器學習模型、深度學習模型輔助標註。
文字分類模型採用fasttext,實體識別採用bert+bilstm+crf,三元組抽取採用bert。
後端web框架使用django,前端使用vue。
NLP標註工具Brat
文字標註 文字標註工具brat的使用 2019常用nlp標註工具簡單介紹 nlp標註工具 yedda 2016 python 可以在windows上裝 優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。doccano 2019 可以在wi...
2019常用NLP標註工具簡單介紹
yedda 2016 python 可以在windows上裝 優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。doccano 2019 可以在windows上裝 支援命名實體識別,情感分類,機器翻譯任務,介面比較友好。prodigy 2...
文字匹配工具正式開源
當前版本號 0.1.12 update 2020 6 12 rulelib.py 類庫,可自行引用到專案中使用 ruleeditor.py 規則編輯器,基於flask的web應用,可在瀏覽器中編輯規則 rulepicker.py 規則提取器,可載入規則後從批量檔案中提取匹配結果 文字匹配工具,使用簡...