開源NLP文字標註工具CatchingFire

2021-10-19 10:33:49 字數 457 閱讀 2389

做過nlp相關工作內容的小夥伴應該都知道標註資料才是最花時間的部分,因此乙個好用的標註工具來提高標註效率尤為重要。

調研了多個開源工具後,發現現有大多數標註工具都只是簡單的標註功能,並沒有利用模型智慧型輔助標註。因此閒暇之餘開發了標註工具catchingfire(因為標註工具雖然看起來不重要,但是在nlp任務當中佔據極為重要的部分,catchingfire也就是星星之火可以燎原的意思)。

標註工具位址為

架構圖如下:

功能包括實體識別標註、文字分類標註、三元組抽取標註。支援規則、機器學習模型、深度學習模型輔助標註。

文字分類模型採用fasttext,實體識別採用bert+bilstm+crf,三元組抽取採用bert。

後端web框架使用django,前端使用vue。

NLP標註工具Brat

文字標註 文字標註工具brat的使用 2019常用nlp標註工具簡單介紹 nlp標註工具 yedda 2016 python 可以在windows上裝 優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。doccano 2019 可以在wi...

2019常用NLP標註工具簡單介紹

yedda 2016 python 可以在windows上裝 優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。doccano 2019 可以在windows上裝 支援命名實體識別,情感分類,機器翻譯任務,介面比較友好。prodigy 2...

文字匹配工具正式開源

當前版本號 0.1.12 update 2020 6 12 rulelib.py 類庫,可自行引用到專案中使用 ruleeditor.py 規則編輯器,基於flask的web應用,可在瀏覽器中編輯規則 rulepicker.py 規則提取器,可載入規則後從批量檔案中提取匹配結果 文字匹配工具,使用簡...