清華大學自然語言處理實驗室近日發布了 openke 平台,整合了 transe、transh、transr、transd、rescal、distmult、hole、complex 等演算法的統一介面高效實現,以及面向 wikidata 和 freebase 預訓練知識表示模型。該專案旨在為開發者與研究人員提供便利。github:
openke 是乙個開源的知識表示學習平台,由 thunlp 基於 tensorflow 工具包開發。在 openke 中,我們提供了快速和穩定的工具包,包括最流行的知識表示學習(knowledge representation learning,krl)方法。該框架具有容易拓展和便於設計新的知識表示學習模型的特點。
該框架有如下特徵:
基準測試
一些資料集如 fb15k、fb13、wn18 和 wn11 通常用於知識表示學習的基準測試。我們以 fb15k 和為 wn18 為例介紹我們的框架的輸入檔案的格式。
資料集有以下五種格式:
fb15k、wn18:
fb13、wn11:
工具包我們提供了多個知識表示學習的工具包,包括以下四個資源庫:
openke
這是乙個基於 tensorflow 的知識表示學習(krl)的高效實現。我們使用 c++實現了一些基礎操作,如資料預處理和負取樣。每乙個特定的模型都用 tensorflow 和 python 介面實現,因此能方便地在 gpu 上執行模型。
openke 提供了訓練和測試多種 krl 模型的簡易介面,無需在冗餘資料處理和記憶體控制上花費太多功夫。openke 實現了一些經典和高效的模型用於支援知識表示學習,這些模型包括:
我們提供了訓練這些模型的教程:
此外,我們還使用一些簡單的例子展示了如何基於 openke 構建乙個新模型。
kb2e
kb2e 是一些知識嵌入模型的早期實現,我們之前的研究中使用了很多資源。這些**將被逐漸納入新框架 openke。這是乙個基礎且穩定的知識圖譜嵌入工具包,包括 transe、transh、transr 和 ptranse。該工具包的實現遵循模型的原始檔案設定,使其在研究實驗中保持穩定。
fast-transx
這是 transe 及其擴充套件模型用於知識表示學習的高效輕量級實現,包括 transh、transr、transd、transparse 和 ptranse。整個框架的底層設計為實現加速作出改變,且該框架支援多執行緒訓練。fast-transx 旨在使用 openke 框架實現快速、簡單的部署。
tensorflow-transx
openke 基於 tensorflow 的簡易版,包括 transe、transh、transr 和 transd。與 fast-transx 類似,tensorflow-transx 旨在避免使用 openke 框架產生的複雜封裝。
預訓練嵌入
現有大規模知識圖譜使用 openke 對嵌入進行預訓練(目前都通過 transe 進行訓練。必要時會介紹更多模型)。
知識圖譜和嵌入包括以下五個檔案:
蓋茨清華大學演講
尊敬的顧校長,清華大學的老師 同學們 獲得清華大學這所世界一流大學的榮譽博士學位,讓我感到非常榮幸。清華是所有著百年歷史的名校,這裡誕生了很多傑出的科學家 商業和政治領袖。我上一次造訪貴校是在1997年。當時,貴校學生的才華 熱情和創造性給我留下了很深的印象。之後,我決定在中國設立微軟研究院。在沈向...
清華大學 自學能力
一 永遠不要說你已經盡力了 我在高中時體育特別差,跑1000公尺都很要命,從來都是不及格。到了清華之後,第一節體育課,老師告訴我們每年要測3000公尺長跑,跑不過不許畢業,取消推研資格。怎麼辦?於是每天晚上10 30,我們的自習教室關門,操場上的人就多起來了。跑半個小時再回寢室繼續學習,練了乙個學期...
查詢學生資訊 清華大學
牛客網題目鏈結 排序題。先儲存再查詢 include include include include include include include include include include using namespace std const int n 1005 typedef pair i...