什麼叫python爬蟲 Python 爬蟲是什麼

python爬蟲即使用python程式開發的網路爬蟲（網頁蜘蛛，網路機械人），是一種按照一定的規則，自動地抓取全球資訊網資訊的程式或者指令碼。通俗的講就是通過程式去獲取web頁面上自己想要的資料，也就是自動抓取資料。

python 爬蟲即使用 python 程式開發的網路爬蟲（網頁蜘蛛，網路機械人），是一種按照一定的規則，自動地抓取全球資訊網資訊的程式或者指令碼。另外一些不常使用的名字還有螞蟻、自動索引、模擬程式或者蠕蟲。其實通俗的講就是通過程式去獲取 web 頁面上自己想要的資料，也就是自動抓取資料。

python 爬蟲架構

網頁解析器：將乙個網頁字串進行解析，可以按照我們的要求來提取出我們有用的資訊，也可以根據 dom 樹的解析方式來解析。網頁解析器有正規表示式（直觀，將網頁轉成字串通過模糊匹配的方式來提取有價值的資訊，當文件比較複雜的時候，該方法提取資料的時候就會非常的困難）、html.parser（python 自帶的）、beautifulsoup（第三方外掛程式，可以使用 python 自帶的 html.parser 進行解析，也可以使用 lxml 進行解析，相對於其他幾種來說要強大一些）、lxml（第三方外掛程式，可以解析 xml 和 html），html.parser 和 beautifulsoup 以及 lxml 都是以 dom 樹的方式進行解析的。

應用程式：就是從網頁中提取的有用資料組成的乙個應用。

爬蟲可以做什麼？

爬蟲的本質是什麼？

模擬瀏覽器開啟網頁，獲取網頁中我們想要的那部分資料

瀏覽器開啟網頁的過程：

當你在瀏覽器中輸入位址後，經過 dns 伺服器找到伺服器主機，向伺服器傳送乙個請求，伺服器經過解析後傳送給使用者瀏覽器結果，包括 html,js,css 等檔案內容，瀏覽器解析出來最後呈現給使用者在瀏覽器上看到的結果

所以使用者看到的瀏覽器的結果就是由 html **構成的，我們爬蟲就是為了獲取這些內容，通過分析和過濾 html **，從中獲取我們想要資源。

什麼叫python爬蟲 Python 爬蟲是什麼

python 爬蟲是什麼 python爬蟲什麼意思

python爬蟲什麼意思 python爬蟲什麼意思

什麼叫表示式？什麼叫語句？

什麼叫python爬蟲 Python 爬蟲是什麼

python 爬蟲是什麼 python爬蟲什麼意思

python爬蟲什麼意思 python爬蟲什麼意思

什麼叫表示式？什麼叫語句？

相關推薦