Python 爬蟲入門2 獲取搜狗的搜尋結果

2021-10-22 02:48:39 字數 774 閱讀 6415

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# 需求:爬取搜狗首頁的頁面資料

# noinspection pyunresolvedreferences

import requests

if __name__ == '__main__':

#ua偽裝:將訪問物件偽裝為瀏覽器

headers=

#爬蟲主體

url=''

# 1. 處理url攜帶的引數:封裝到字典中

keyword=input('搜狗搜尋:')

param=

# 2. 獲取資料

response=requests.get(url=url,params=param,headers=headers)

page_text=response.text

# 3. 資料持久化

filename=keyword+'.html'

with open(filename,'w',encoding='utf-8')as fp:

fp.write(page_text)

print('爬取完畢!')

結果:

python爬蟲入門訓練 2

這次的爬蟲訓練是對豆瓣top250資訊的爬取,比較簡單的靜態頁面的爬取,本人也是初學者,為了防止學習的困難,我盡量寫的詳細點,建議先把 複製一遍,看能不能成功執行,再過來看,免得到時候全部看完了,不能執行,到時候自己解決也是蠻麻煩的,畢竟爬蟲更新換代也是蠻快的 對豆瓣top250所有資訊進行爬取,包...

Python爬蟲入門(2) 爬蟲基礎了解

爬蟲,即網路爬蟲,大家可以理解為在網路上爬行的一直蜘蛛,網際網路就比作一張大網,而爬蟲便是在這張網上爬來爬去的蜘蛛咯,如果它遇到資源,那麼它就會抓取下來。想抓取什麼?這個由你來控制它咯。比如它在抓取乙個網頁,在這個網中他發現了一條道路,其實就是指向網頁的超連結,那麼它就可以爬到另一張網上來獲取資料。...

爬蟲入門 2

一 bs4的功能與使用 成功 from bs4 import beautifulsoup import requests r requests.get demo r.text soup beautifulsoup demo,html.parser print soup.prettify 有層次感的輸...