PHP搜尋引擎

2021-06-27 04:06:11 字數 1014 閱讀 6428

簡單php搜尋引擎源**,需要開啟php的curl擴充套件。功能:對某一**進行檢索,獲取**基本資訊,同時提取**的所有連線。

<?php

class engine

//啟動引擎

public function start()

//獲取meta內容

public function getmeta($content)

//獲取body內容

public function getdetail($content)

//獲取title內容

public function gettitle($content)

//獲取a鏈結

public function getlinks($content)

//socket監聽

public function socketopen($url)

else

fclose($fp);

var_dump($content);exit;

return $content;}}

//獲取指定url內容

public function getcontent($url)

//取出script和style標籤

public function striphtml($string)

//去除陣列元素的標籤

public function striptags(&$arr)

else

}return $arr;

}function show()

//end class engine

}$engine = new engine('');

$engine->start();

$engine->show();

?>

這只是引擎的主要部分,接下來要做的就是把相關資訊存入資料庫,然後接著對所有獲取的連線再去檢索,然後把相關資訊再存入資料庫,那麼核心部分就是我們獲取了這些資訊之後根據資訊內容來設定**的關鍵字,然後給他乙個排名,供以後搜尋。

搜尋引擎 索引

正排索引 文件編號,單詞編號,單詞的數量,單詞出現的位置。倒排索引 1,單詞詞典,儲存單詞以及統計資訊,單詞在記錄表中的便宜,可常駐記憶體,用雜湊表儲存。2,記錄表,單詞對應的文件集合,記錄單詞出現的數目 位置。文件採用差分變長編碼。其中文件可按編號公升序排列 可利用差分編碼 也可按出現次數排列,可...

MySQL搜尋引擎程式 mysql搜尋引擎

mysql是我們比較常用的一種資料庫軟體。它有著諸多的優點,如開源的,免費的等等。其實它還有乙個很好的特點,那就是有多種引擎可以供你選擇。如果賽車手能根據不同的路況,地形隨手更換與之最適宜的引擎,那麼他們將創造奇蹟。然而目前他們還做不到那樣便捷的更換引擎,但是我們卻可以 所謂知己知彼方可百戰不殆,要...

搜尋引擎 倒排索引

本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件,每行代表乙個單詞,打對勾的位置代表包含關係。圖3...