初窺語義搜尋

2022-05-19 18:17:07 字數 1130 閱讀 6137

全球資訊網之父tim berners-lee的解釋是

語義搜尋的本質是通過數學來拜託當今搜尋中使用的猜測和近似,並為詞語的含義以及它們如何關聯到我們在搜尋引擎輸入框中所找的東西引進一種清晰的理解方式。

這個介紹是看不太懂的,我就簡單的說一下我的理解:字面意思理解「語義」就是不單單看搜尋的本質,我們平常的搜尋用的一般都是關鍵字搜尋,搜尋內容也都是包含要搜的內容。語義搜尋則是透過現象看本質,舉個簡單的例子:我們搜尋「夢字去掉林」,語義搜尋則是直接出現「夕」,不會去包含我們搜尋內容。

語義搜尋試圖以人的方式理解自然語言

語義搜尋描述了搜尋引擎嘗試通過以下方式生成最準確的結果:

搜尋者意圖、

查詢上下文、

單詞之間的關係

例如,如果你問你的朋友「最大的哺乳動物是什麼?」然後跟著這個問題說「它有多大?」你的朋友會明白「它」是指最大的哺乳動物:藍鯨。

知識圖譜是2023年推出的,是google在實現實體和上下文對關鍵字字串的重要性的第一步 – 或者,正如谷歌所說,「事情,而不是字串」。

知識圖為即將進行的大規模演算法更改奠定了基礎。

作為乙個龐大的公共資訊資料庫,知識圖譜收集了被視為公共領域的資訊(例如,到月球的距離,亞伯拉罕林肯的**任期,「星球大戰」的演員陣容等)以及每個實體的屬性(人們有生日) ,兄弟姐妹,父母,職業等)。

google的hummingbird更新於2023年推出,可以說是我們今天所知的語義搜尋時代的開始。

hummingbird確保「符合意義的頁面做得更好,而不是只匹配幾個單詞的頁面」 – 這意味著更好地匹配搜尋者上下文和意圖的頁面將比重複無上下文關鍵字令人作嘔的頁面排名更好。

2023年,谷歌推出了rankbrain,這是乙個機器學習系統,既是排名因素,也是智慧型查詢分析ai。

像hummingbird一樣,rankbrain試圖理解查詢背後的使用者意圖,它們之間的關鍵區別是rankbrain的機器學習元件。

rankbrain始終在學習,分析效能最佳的搜尋結果,並尋找使用者認為有價值的頁面之間的相似性。

因此,rankbrain可能認為頁面對查詢是「良好響應」,即使它不包含查詢中的確切單詞。

參考文章:

Scrapy 初窺筆記

scrapy startproject yourprojectname 建立scrapy專案 開始爬蟲 scrapy crawl spidername 開始執行爬蟲 以上仿麻煩 根目錄新建執行檔案 from scrapy.cmdline import execute execute scrapy c...

初窺Shell 指令碼

1 shell是什麼 shell指令碼就是利用shell的命令解釋的功能,對乙個純文字的檔案進行解析,然後執行這些功能,也可以說shell指令碼就是一系列命令的合集。shell可以直接使用在win unix linux上面,並且可以呼叫大量系統內部的功能來解釋執行程式,如果熟練使用並掌握shell指...

batch normal機制初窺

參考文獻 大家都做過對資訊的處理。在這個過程中,我們會發現,由於影象的畫素是0 255之間。這就說明,在整個過程中,我們發現其值永遠在第一象限中。假設我們想用方程max wx b 來進行分類。那整個過程中,訓練的目的,就是訓練w和b。w的初始化,一般是從高斯分布中進行隨機初始化的。有正有負。這個時候...