網路爬蟲之簡單例子

2021-07-28 03:09:49 字數 1329 閱讀 8699

網路爬蟲的簡單例子

###京東頁面的簡單爬取

import requests

url=""

try:

r=requests.get(url)

r.raise_for_staus()

print(r.text[:1000])

except:

print("爬取失敗")

###對於像亞馬遜的**會反爬蟲需要偽裝成瀏覽器

import requests

url="###"

##亞馬遜的**

try:

kv=r=requests.get(url,headers=kv)

r.raise_for_staus()

print(r.text[:1000])

except:

print("爬取失敗")

##

###

import requests

keyword="pyhton"

try:

kv=r=requests.get("",params=kv)

r.raise_for_status()

print(r.text[:1000])

except:

print("爬取失敗")

###爬取的**

import requests

import os

url=""

root=""

##的根目錄

path=root+url.split('/')[-1]

try:

ifnot os.path.exists(root):

os.mkdir(root)

ifnot os.path.exists(path):

r=requests.get(url)

with open(path,'wb') as f:

f.write(r.content)

f.close()

print("檔案儲存成功")

else:

print("檔案已經存在")

except:

print("爬取失敗")

####ip位址的歸屬地的自動查詢

import requests

url=""

try:

r=requests.get(url+'202.204.80.112')

r.raise_for_status()

print(r.text[-500:])

except:

print("爬取失敗)

網路爬蟲例子

一 最簡單的乙個例子 如下 import requests url res requests.get url res.encoding utf 8 print res.text res.text是網頁的內容,就是在瀏覽器中檢視網頁源 看到的內容 上面的 requests 就是用來訪問網路獲取資訊的模...

JAVA實現簡單網路爬蟲

這是我第一次寫部落格,所以寫的不算好,看到的人請見諒。gethtml 類,首先是url url1 new url url 模擬在網頁輸入 接著 urlconnection uc url1.openconnection 模擬敲回車鍵開啟該 頁面,後面的看注釋應該能看懂了。bf.readline 是依次...

php網路爬蟲教程 PHP網路爬蟲之CURL詳解

php的curl可以實現模擬http的各種請求,這也是php做網路爬蟲的基礎,也多用於介面api的呼叫。這個時候有人就要發問了 為什麼你特麼不用file get contents?curl的效能比它好,而且可以完成更多複雜的操作,不僅僅只是獲取頁面資料。下面先分別介紹一些常用的函式。curl ini...