semantic 瘦語義網的幾點想法

2021-09-08 09:28:29 字數 1762 閱讀 3112

2013-01-31 增補:整理了乙個《lean semantic web講義提綱》, 提綱全文在github上。

這一年多來在工業界的實踐,我總結經驗和教訓為「瘦語義網」(lean semantic web)。

顧名思義,這個說法是從「lean startup」(精益創業)引申出來的,或者說是lean startup在semantic web上的應用。所以lean semantic web最合適的翻譯還是「精益語義網」。不過「瘦」聽起來簡單點,就先這麼叫吧。

leansemanticweb.com是今後系統總結這個概念的地方。現在還沒有什麼內容,等以後自由時間多了再去填坑吧。

這裡只能簡單的總結幾點原則問題。

瘦的意思並不只是更簡單、簡化現有的語義網技術。它的核心思想是****** things people want,也就是為人民服務。(參前文《語義網是給人用的》2011-12-20)

人民不僅包括使用者,也包括為使用者服務的工程師們。語義技術不是萬靈藥,不是人工智慧的什麼突破,也不是從天上掉下來的。好的市場和技術都是演化出來的,很少是突然的革命。如何讓開發和使用這個技術最符合工程師和使用者的需要,如何從現實基礎演化,是語義網的最關鍵問題。

由此引申一些想法。

首先是使用者和市場的一些想法

a.  目前結構化資料,特別是高質量圖結構的資料已經成為提公升使用者體驗的核心問題

c. 在語義網上實現突破的必然是小公司(the next big thing)。現有的大公司很難服務好早期核心使用者。

d. 語義技術的突破點看似不會在繼續深化社交網路(social network)這種關係上,雖然這個還很熱。資訊網路(information network)是個高質量資料更豐富的世界。

e. 語義資料到目前為止還都是小資料。市場潛力最大的是小而高質量資料的集合。不要迷失在大資料的各種buzz和hype裡。

其次是技術上的一些想法

1. 語義就是關係,知識是用來發現新關係的資料。語義資料的核心問題是資料質量。知識是資料中質量較高的部分。

2. 實踐中的語義網是nonrdf: not-only rdf。不要拘泥於rdf這種交換格式和它的種種變化(如rdfa, microformat)

3. 目前階段最有工程基礎的語義資料交換格式是json。資料交換格式和資料儲存格式可以分離。

4. uri做資源定址方式是昂貴和不符合使用者需要的。字串在大多數情況滿足大多數使用者的需要。

5. 凡是不能做到(使用者感知到的)常數時間響應的系統都是胡扯

6. 語義網技術並不是單一的資料交換格式和查詢。完整的應用系統,幾乎都要包括自然語言處理,資訊檢索,結構化資料儲存,結構化資料查詢,資料質量的提公升,隱含關係的發現(機器學習或推理),探索或啟發式使用者介面等模組的整合。

7. 現階段能規模化的語義關係很淺,只有同義關係、分類樹關係、傳遞關係(transitive property),至多加上路徑查詢(path query)。這是資料庫和資訊檢索的基礎設施決定的。先規模化這些關係,循序漸進才能處理更多的關係

8. 弱耦合的系統構架。盡可能重用現有成熟技術。盡可能利用好雲計算基礎設施

9. 懶(lazy)系統. just-in-time knowledge, just-in-time computation, pay-as-you-go benefit,減少初始投資要求

10. 工具系統建設是瓶頸。成熟好用的nonrdf語義網工具生態系統可能還需要5-10年的建設時間。

先就拋磚引玉胡說這幾句,求教於方家。

semantic 本體和語義網的研究方向

研究方向 1 本體建模 本體定義元模型 本體視覺化建模,模型到本體的轉換.2 本體學習 本體抽取 形式概念分析 自然語言處理.3 本體儲存 rdf owl儲存 本體 關係對映 本體資料庫 物件導向資料庫 演繹物件導向資料庫 4 本體查詢 rdf查詢語言 本體查詢語言.5 本體推理 描述邏輯 描述邏輯...

語義網面臨的問題

語義網最大的好處就是可以讓計算機具有對網路空間儲存的資料進行智慧型評估的能力。這樣,計算機就可以不僅僅處理資料還可以像人腦一樣理解資訊的含義。資料一直是語義網的核心問題。w3c定義了一些語義網規範如,rdf,rdfsowl等。但目前,網際網路上絕大部分內容並不符合語義網規範。因此,如何高效地從非結構...

語義網的學習資源大匯集 備忘

網上資源 入門材料 中文資料 英文資料 semantic web 工具列表 本體庫 semantic web相關 w3china.org主頁 語義網 描述邏輯 本體 rdf owl 論壇 w3china.org 開放翻譯計畫 spec 語義網論壇,有很多資料 wonderweb 歐洲研究sw的主要力...