deepdive是由史丹福大學infolab實驗室開發的乙個開源知識抽取系統。它通過弱監督學習,從非結構化的文字中抽取結構化的關係資料 。
它是乙個具有語言識別能力的資訊抽取工具,可用作kbc系統(knowledge base construction)的核心,也可以理解為是一種automatic kbc工具。
由於基於語法分析器構建,所以deepdive可通過各類文字規則實現實體間關係的抽取。
deepdive面向異構、海量資料,所以其中涉及一些增量處理的機制。
paleodeepdive是基於deepdive的乙個例子,用於推測人、地點、組織之間的關係。
deepdive的工作機制分為特徵抽取、領域知識整合、監督學習、推理四步。
deepdive的執行過程可以分為:feature extraction,probabilistic knowledge engineering,statistical inference and learning三部分。
系統結構圖如下(參考
本次學習的過程依照浙江大學於openkg上發表的***eepdive進行文字抽取訓練(修改了自然語言處理的model包,使它支援中文,並提供中文tutorial。後續將持續更新一些針對中文的優化)。
UML學習 第一節
1 uml的基本組成部分 uml主要有圖 元模型組成,主要包括三個基本構造快 事務 things 關係 relationship 和圖 diagram 主要是設計4種事物,4中關係,10種圖。1.1 四種事物 四種事物分別是 結構事物 行為事物 分組事物 注釋事物。結構事物有七中,分別為 類 介面 ...
iOS UI學習 第一節
day1 檢視程式設計入門 什麼是ui command line dos user inte ce 使用者介面 ios7.0 之後,扁平化 之前,擬物化 ios7.0之後ui發生了扁平化的變化 ios座標體系 ui uikit 是乙個framework框架 1.uiwindow 2.uiview u...
LVS學習 第一節
lvs學習 一.centos 6.8 初始化 lvs直接 壓力較小 虛擬機器基礎配置 配置ip位址段 設定主機模式 6臺虛擬機器 cpu 2u 記憶體 1g 硬碟 20g 網絡卡 2塊 網路型別 主機模式 作業系統安裝 desktop安裝 centos6.8初始配置 1.安裝gui介面,啟動改為 預...