面試時被問到倒排索引是什麼該如何快速明了的回答

2021-10-03 02:26:20 字數 338 閱讀 4964

首先先明確幾個關於搜尋引擎中的概念

索引庫(index): 若干個文件的合集.

詞條:原始文件資料按照一定的演算法進行分詞,得到的每乙個詞.例如:我是中國人.其中就有中國,中國人等等.未來可以通過這些分詞後的詞條,來索引到文件.

所以可以這麼回答面試官:所謂的倒排索引,就是將原始的文件進行編號,建立文件索引,形成文件列表.然後對文件進行分詞,得到詞條.再對詞條進行編號,並以詞條建立索引.然後記錄下包含該詞條的所有文件編號.(單個分詞對映到對應的若干個文件,所有分詞和文件對映關係組合起來的就是倒排列表,輔助理解,不用說出). 未來搜尋時,就可以通過對搜尋關鍵字的分詞,然後找到索引庫中對應的文件,這就是倒排索引的原理.

面試時被問到高併發

我目前最處理過最高併發量就是之前參與李寧的電商專案,其實全天也就是剛到百萬級的pv,大概每秒響100pv。個人認為高併發系統的本質就是充分利用硬體資源,並通過提高 和架構的質量進行輔助,以此提公升cpu io裝置的使用率 所以高併發的處理無非三點 伺服器 資料庫 架構。伺服器方面可以提高頻寬 伺服器...

外企面試時,被問到的常見問題

外企面試時,被問到的常見問題 1 請介紹一下你自己。這是外企常問的問題。一般人回答這個問題過於平常,只說姓名 年齡 愛好 工作經驗,這些在簡歷上都有,其實,外企最希望知道的是求職者能否勝任工作,包括 最強的技能 最深入研究的知識領域 個性中最積極的部分 做過的最成功的事,主要的成就等,這些都可以和學...

面試時問到乙個問題,什麼是快取雪崩

早兩天去xx公司面試,面試也有大家都討厭的筆試這一部份。不過我一般不會去寫具體的演算法,只在上面寫上邏輯 如果真的要我寫上具體的演算法,請提供上機環境,畢竟開發與手寫環境不一樣,心情也不一樣。回到正題,裡面有一道題,說到什麼是快取雪崩。因為之前有做過頁面靜態化,後來mvc也有頁面快取這一塊,所以對快...