企業搜尋引擎開發之聯結器connector(一)

2021-09-06 07:00:55 字數 677 閱讀 9665

connector developper guide 

在開發企業搜尋引擎的過程中接觸到google的企業聯結器,精彩不容錯過,在企業搜尋引擎開發過程中提供了乙個很好的設計思路

悲催的是 偌大乙個網路 找不到一篇中文文件,看來

還得要自己研究了

…… 

基於聯結器的企業搜尋引擎設計有點類似於tomcat的設計思路,tomcat的主要元件是聯結器與處理器(容器)

這裡的用於企業搜尋引擎的聯結器用於連線各種不同的資料來源,遮蔽了各種資料來源的差異(相當於資料庫之jdbc) 

處理器從聯結器獲取待處理的資料,進一步解析及索引處理等 

you can find past releases here: 

here is a list of connectors from us:

beta

beta

we also provide additional connectors in our enterprise lab:

lab feature

if you'd like to build a connector of your own, or customize a connector that we provide, you can find the framework here - 

connector manager.

搜尋引擎開發經驗

一 查詢子系統 1 邏輯表示式 綜合的搜尋引擎通常支援邏輯與,邏輯或,邏輯非這三種操作.多個查詢詞的時候要進行邏輯操作,通常空格預設為 如果在多個查詢結果前進行預排序,那麼就可以把原來複雜的邏輯操作轉為有序集合的合併操作,時間複雜度僅為o m n b 網頁排序 網頁與文字的不同,是增加了meta元素...

搜尋引擎索引之索引基礎

本文節選自 這就是搜尋引擎 核心技術詳解 第三章 本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件...

搜尋引擎索引之索引基礎

本文節選自 這就是搜尋引擎 核心技術詳解 第三章 本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件...