隨著internet上資訊快速的增長,對搜尋引擎服務提出了嚴峻考驗。為了提高網頁排名,有 些**只注重人為因素無度優化網頁形式,而忽視基於使用者的**內容建設。為了減少惡意 操縱提高網頁排名的不良競爭,達到為使用者提供最為準確的搜尋結果的目的,搜尋引擎一直 在努力尋求創新的演算法。
下面以google為例**搜尋引擎的新演算法和基於使用者的合理的**優化策略:
1 google搜尋引擎演算法分析
1.1 pagerank演算法
早期google搜尋引擎採用pagerank演算法,pagerank是基於「從許多優質的網頁鏈結過來的網 頁,必定還是優質網頁」的回歸關係,來判定所有網頁的重要性的。
假定頁面a有t1…tn這些頁面指向它。引數d是乙個設定於0與1之間的阻尼係數,我們通常設 d為0.85。另外,c(a)定義為從a出發的連線數量[1]。則頁面a的pagerank值由下 面的公式得出:
pr(a)=(1-d)+d(pr(t1)/c(t1)+…+pr(tn)/c(tn))
Google軟體戰略分析
google夢想或許就是,你醒來第一件事,就是開啟你的手機上的google earth來開始你的生活 通過下一代的twitter來進入直觀的虛擬的網際網路世界,而不是通過今天的瀏覽器。終於google 自己確認了軟體 是未來重點戰略部署之一。這對於it業界 意味著整個行業必將重新改變以前二十年建立起...
Google小組研發模式分析
1.研發模式 採訪描述 關於創新機制,李博士提到,在google有個 點子庫 每個人都可以拋出新點子,讓大家 用腳 投票,即讓認同且願意加入開發的人很快聚集,並一起落實這個點子。因此乙個可行的新點子,從發想到完成只需六個月,而且常常兩三人就能完成 反之,不可行的點子,大家也會提供建議,因此不會有無謂...
Google機器翻譯分析
由 www.lucene.com.cn 提供 史洪柏 葛帥 3 generalized ebmt的介紹 gereralization 將語句中的某些詞語或短語用更一般的概念來表示。可以很大程度上減少對例項庫規模的需求。泛化採用的基本方法 通過對大規模語料的訓練進行word cluster 來自動的對...