1、搜尋引擎主要核心技術:
中英文分詞語言處理;
排序演算法;
網路爬蟲;
查詢/儲存技術
2、主要涉及的具體技術:
http網路協議;
多執行緒技術;
socket通訊;
高效服務端程式開發;
3、爬蟲:
網路爬蟲使用多執行緒技術,讓爬蟲具備更強大的抓取能力。通過dns cache技術,減少爬蟲對dns的訪問頻率,避免dns成為網路瓶頸,提高抓取速度。
已有亮點:
爬蟲:redis程式,把索引放在記憶體中,具體資料存在在磁碟,能結合記憶體使用與訪問速度快的優點
所需要加強的知識:
排序演算法;
查詢演算法,模式識別;
伺服器併發;
dns cache;
SDE PM DS等相關職位的面試題
因為我這個人面試得有點亂七八糟,從stat到sde到pm到ds都有,就一路想到 貼到 了,抱歉抱歉。有意義的題不多,基本上都是設計題性質,給乙個case讓我做,多半還是open case。先貼題目,反正答案我自己忘記的差不多了。q0 講講你最得意的乙個project。q1 有一組資料,很長,有id,...
面試Java軟體開發職位面試題
1 oracle的分頁 2 jquery中常用的元素查詢方法 3 和 的區別 和 equers 的區別 4 ssh的知識點 5 hibernate的快取 一級 二級 6 map list linklist arraylist 7 設計模式 及作用 8 mabatis和hibernate的區別 9 介...
利用Pyspider爬取BOSS相關職位資訊
利用pyspider爬取boss職位資訊 pyspider初步 usr bin env python encoding utf 8 created on 2019 04 23 16 01 48 project boss from pyspider.libs.base handler import f...