文字匹配模型TextMatching

2021-10-17 08:46:31 字數 1328 閱讀 6772

個人心得:

文字匹配問題可轉化為二分類問題,輸出概率則為相似度

將影象識別的思路應用於文字匹配任務中,利用卷積抽取文字特徵

textmatching模型架構如圖所示。

我們將模型架構拆解為如下幾個步驟:

文字嵌入

本文方法首先利用詞向量模型得到文字或者句子中的每個詞的embedding向量,這一步也是非常通用的步驟,目前主流的詞向量模型為word2vec/fasttext/glove/bert等,本文選用glove。

計算相似度矩陣

對待匹配的文字(具體而言是乙個二維陣列,每一維是文字中每個詞的embedding向量)進行外積,得到每個詞之間的相似度得分。如果兩個文字分別由m,n個詞組成,那麼,相似度矩陣大小為m*n。作者提供了三種詞與詞之間的相似度得分計算方法:

a. 0-1型別,對應的詞相同為1,否則為0。這種方法的缺點在於無法捕獲相似詞間的語義匹配關係。

b. cosine相似度

c. 點積

經實驗,方案3的效果最佳。

cnn特徵提取

為什麼說本文的思路是像影象識別一樣作文本匹配呢?關鍵一步就是作者使用了影象識別中常用的cnn卷積層來提取文字特徵。textmatching模型使用了兩層cnn從相似度矩陣中抽取特徵。這裡需要注意的一點是,不同的文字對產生的文字相似度矩陣大小是不一致的,為了讓cnn抽取的feature map在輸入到全連線層時能夠在尺寸上保持一致,作者在第一層cnn後使用了一層動態pooling層來動態調整feature map尺寸。

全連線層

經cnn抽取特徵後,textmatching將特徵送入兩層全連線層,再經softmax得到模型推理結果,輸出的概率值即可認為是文字對的匹配程度。

作者將本文模型與其他主流文字匹配模型進行對比,可以看出,本文提出的textmatching模型效果還是優於當時的主流模型的。

本文介紹了一種文字匹配的經典工作,其思路是將基於cnn的影象識別思路引入文字匹配模型中,進而提公升文字匹配效果。

文字匹配方法系列 BERT匹配模型

在介紹深層次互動匹配方法之前,本文接著多語義匹配方法 1 介紹基於bert模型實現文字匹配的方法。將其單獨介紹主要因為bert實現文字匹配操作方便且效果優秀,比較適用於工業應用場景。關於bert模型,devlin,j.chang,m.w.lee,k.toutanova,k.2018 2 在 中有較為...

文字匹配 文字相似度模型之BiMPM

本文是對 bimpm bilateralmulti perspectivematchingfornaturallanguagesentences的解讀。該模型主要用於做文字匹配,即計算文字相似度。文字匹配是nlp領域較為常見的技術,但是大部分的匹配方法都是從單一的角度去做匹配,例如abcnn把兩個句...

深度文字匹配

最近在了解文字匹配相關一些實現和演算法。在資訊檢索系統裡面,如何釐清文字的相關性,是乙個非常關鍵的問題。所謂的相關性,主要包括兩個方面,乙個方面是文字相關性,還有乙個語義的相關性。在經典的模型裡面,比較常見的做法是向量空間模型 vector space model 向量空間模型,原理則是將query...