**作者 | 塗存超、劉晗、劉知遠、孫茂松(清華大學&東北大學)
特約記者 | 張詩悅(北京郵電大學)
首先,介紹「網路表示學習(network embedding)」的概念。網路資料形式可以自然地表達物體和物體間的聯絡。「網路表示學習」目的是將網路中的節點用乙個低維的實值向量進行表示,每個節點的表示向量蘊含了該節點的網路結構等資訊。傳統的網路表示學習往往將網路中的節點表示成乙個固定不變的向量。然而,真實世界中的網路節點在與其他節點進行互動時,往往會展現出不同方面的特點。例如,乙個研究者與不同的研究者發生合作關係往往因為不同的研究主題;社交**中的使用者會因為不同的原因與其他使用者建立聯絡。如圖 1 所示,中間的學者在與右邊作者發表**時,很顯然會發表 machine translation 相關的工作,而在和左邊作者合作時則會是 syntactic parsing 相關的**。考慮到網路節點的這種動態性,僅僅用乙個固定的向量作為節點的表示,很顯然是不合適的。此外,這些方法也不能對節點之間的關係進行有效的建模和解釋。因此,如何對節點根據其鄰居的不同學習動態的表示,以及如何對節點之間的關係進行解釋,是網路表示學習面臨的挑戰。
▲ 圖 1:同一使用者對於不同鄰居展現出不同角色
因此,在塗博士等人的工作中提出了一種「上下文敏感的網路表示學習模型(context-aware network embedding)」,如圖 2 所示。該模型希望借助網路節點上額外的文字資訊對網路節點的表示和節點之間的關係進行動態地建模。模型假設每個節點的表示向量由「結構表示向量(vs)」和「文字表示向量(vt)」兩部分構成。其中,「 文字表示向量(vt)」是由節點的文字資訊通過卷積神經網路生成的。圖 2 中 u, v 兩個節點首先分別通過卷積神經網路生成了 p, q 兩個文字表示矩陣。而後,為了根據 u, v 節點之間的關係進行動態地表示學習, 採用了「互相注意力機制」,生成了 ap, aq 兩個注意力向量,分別作用於 p, q 得到最終兩節點的文字表示向量 ut(v), vt(u)。
▲ 圖 2:利用互相注意力機制生成節點的文字表示向量
因為節點的文字表示向量的生成過程是跟鄰居相關的,因此將其稱之為「上下文敏感的表示向量」。同時,注意力的結果能夠反映出節點對於鄰居節點文字資訊的關注點,從而能夠對關係進行解釋。如圖 3 所示,通過上下文敏感的表示學習,節點a和不同的節點 b, c 之間呈現出不同的「注意力」,因此也解釋了 ab, ac 之間不同的關係。同時,該**通過實驗驗證了「上下文敏感的表示向量」的有效性,在三個網路資料集上的鏈結**任務中均取得了最好的效果,並在節點分類任務上與前人工作可比。
▲ 圖 3:利用互相注意力結果對節點之間關係進行解釋
提及這個工作的應用場景,作者說「可以運用到許多社交網路分析任務中,例如網路節點分類、聚類,鏈結**,社群發現等等。在真實的社交網路中,一般會對應著使用者畫像、好友推薦等任務。」關於這個工作現在的不足之處和未來的方向,作者表示「這篇**通過 mutual attention 的結果對節點之間的關係進行解釋,這種關係仍然是一種隱式的關係,怎麼樣能夠對顯示的關係的做出解釋,比如說家人、朋友、同事、師生等,是我們之後關注的問題。」 讓我們共同期待他們的未來工作!
cane: context-aware network embedding for relation modeling
關於中國中文資訊學會青工委
中國中文資訊學會青年工作委員會是中國中文資訊學會的下屬學術組織,專門面向全國中文資訊處理領域的青年學者和學生開展工作。
關於*****weekly
50 別逗我了,好吧
中文社群 開發者軟體位址 威鋒網 有用的庫 產品經理 專案 開發經理 技術總監 產品負責人 技術大牛 核心技術骨幹,架構師,技術培訓,技術支援,軟體質詢,寫書,首席科學家 技術講師 創業 p12 pem openssl pkcs12 in certificatename.p12 out certif...
天冷了別感冒了
這尼瑪的gui天氣下降的讓我猝不及防。昨天晚上出去吃個晚飯都快凍成gou了。今天更加冷,今天都1度了。加上北風那個吹,冷的我都不敢出門了。又有這麼久沒更博了。誒,天冷了,整個人都變懶了一些。手好僵硬,打字都比以前慢了好多。計畫一下,接下來的兩三天就要準備前去浙江了。去看一看老表的公司怎麼樣。雖然說以...
知道自己不足了
今天去華為面試了,技術麵裡,自己的知識水平顯的太單薄了,只會c語言,而且一些資料結構的知識也不是很精通。面試那人也許覺得我這水平和我提出的工資條件不是很匹配吧,所以就直接給我說技術不過關,不用面後面了。雖然,我一開始就不是很想去華為,但聽到這一說,還是感覺有點受打擊,但同時也知道了自己的不足,做的東...