connector developper guide
在開發企業搜尋引擎的過程中接觸到google的企業聯結器,精彩不容錯過,在企業搜尋引擎開發過程中提供了乙個很好的設計思路
悲催的是 偌大乙個網路 找不到一篇中文文件,看來
還得要自己研究了
……
基於聯結器的企業搜尋引擎設計有點類似於tomcat的設計思路,tomcat的主要元件是聯結器與處理器(容器)
這裡的用於企業搜尋引擎的聯結器用於連線各種不同的資料來源,遮蔽了各種資料來源的差異(相當於資料庫之jdbc)
處理器從聯結器獲取待處理的資料,進一步解析及索引處理等
you can find past releases here:
here is a list of connectors from us:
beta
beta
we also provide additional connectors in our enterprise lab:
lab feature
if you'd like to build a connector of your own, or customize a connector that we provide, you can find the framework here -
connector manager.
搜尋引擎開發經驗
一 查詢子系統 1 邏輯表示式 綜合的搜尋引擎通常支援邏輯與,邏輯或,邏輯非這三種操作.多個查詢詞的時候要進行邏輯操作,通常空格預設為 如果在多個查詢結果前進行預排序,那麼就可以把原來複雜的邏輯操作轉為有序集合的合併操作,時間複雜度僅為o m n b 網頁排序 網頁與文字的不同,是增加了meta元素...
搜尋引擎索引之索引基礎
本文節選自 這就是搜尋引擎 核心技術詳解 第三章 本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件...
搜尋引擎索引之索引基礎
本文節選自 這就是搜尋引擎 核心技術詳解 第三章 本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件...