實體 關係聯合抽取 入門資料彙總

2021-10-01 08:30:43 字數 590 閱讀 6045

寫在前面:實體-關係聯合抽取這個方向剛剛入門就要換方向了,很不捨,因此將自己這段時間看的一些入門資料分享出來,供大家學習,希望能起到一些拋磚引玉的作用。如有一絲幫助到您,請點讚支援,謝謝!!!

1、命名實體識別/關係抽取標註工具

② ncrf++:序列標註模型

③ deepdive:史丹福大學開源知識抽取工具包(三元組抽取)

④ hanlp:面向生產環境的自然語言處理工具包

總結:現有的命名實體識別/關係抽取模型大多只提供最基本的實體/關係型別,比如:人名、地名、機構名等,因此,對於更細粒度的實體區分起不到作用。如果自己需要按照自己的類別對實體進行分類,最好進行手動標記。

2、手動標註工具

② poplar

是乙個企業的內部標註程式,支援性不要,容易崩潰,且要求待標註的資料是json資料。

③ cogcomp-nlpy

缺點:只能進行實體標註,無法標註關係。

neuronerbrat

該工具是為了實體識別和關係抽取設計的,但可用於各種nlp任務。

實體關係抽取學習記錄

暑假要開始上手知識圖譜的專案了,所以就把之前的那些學習積累做乙個簡要的梳理,加油,你的所有積累都會在某一天帶給你意想不到的驚喜 接下來進入正題 但是有監督學習中人工標註資料十分侷限,並且還要做實體對齊那麼一旦面對巨大的資料量,就顯得工作量巨大繁雜。遠端監督就成為大家的寵兒。遠端監督認為知識圖譜中可獲...

實體關係抽取的現狀與未來

來到 2019 年的今天,深度學習的諸多侷限性也慢慢得到廣泛認知。對於自然語言處理而言,要做到精細深度的語義理解,單純依靠資料標註與算力投入無法解決本質問題。如果沒有先驗知識的支援,中國的桌球誰都打不過 與 中國的足球誰都打不過 在計算機看來語義上並沒有巨大差異,而實際上兩句中的 打不過 意思正好相...

實體關係抽取任務及其解決思路

在nlp領域中,關係抽取任務,指的是為了構建知識圖譜,從結構化 表1 半結構化 表2 非結構化資料 表3 獲取形式為 事物1 關係 事物2 的三元組的活動。一些情況下,我們會想辦法把關係抽取抽象成若干三元組的抽取,而不會做 四元組 五元組的抽取。表1 若干文學形象的結構化資訊 結構化程度與實體關係抽...