# !/usr/bin/env python
# -*- coding:utf-8 -*-
import requests
import re
for i in range(1, 5):
print("pagenumber:%d" % i)
response = requests.get(
"" + str(i) + "/",
verify=false) # url拼接,range(1, 5),即選擇前4頁
# print(response.text) # 除錯用**
content = re.findall(r'\n(.*?)', response.text, re.s)
for j in range(0, len(content)):
print("jokernumber:%d\n%s\n" % (j, content[j].strip("\n").replace("
", "")))
先編寫print(response.text),然後寫出正規表示式
. 匹配除換行符 \n 之外的任何單字元
re.s 即為 . 並且包括換行符在內的任意字元(. 不包括換行符)
注意有個
執行結果:
Python爬蟲實戰 獲取糗事百科上面的笑話
目的 獲取糗事百科的笑話,並儲存為檔案。結果 usr bin python3 coding utf 8 import urllib.request import re 瀏覽器偽裝池,將爬蟲偽裝成瀏覽器,避免被 遮蔽 opener urllib.request.build opener opener....
簡單爬取糗事百科
剛剛入門,對於爬蟲還要折騰很久才行,雖然很多功能還沒開始掌握,但是爬取下來就很開心,接下來還會爭取進步的。把自己出現的一些錯誤都加上了注釋,我目前還在學習當中,大家一起進步。期間學了乙個新的函式,在這裡分享下 strip 網上是這麼說的 需要注意的是,傳入的是乙個字元陣列,編譯器去除兩端所有相應的字...
糗事百科 三
爸,老師讓你去學校一趟。你又闖什麼禍了!打。打抱不平來著。打抱不平?常言道虎父無犬子,真不愧是我兒子 老師 看你兒子把鮑步平小朋友打的!怎麼陪吧!記得前一陣熱播民兵葛二蛋,然後我們全家都姓葛.割了一把心酸淚.中午吃飯的時候弟弟特委屈的問我,姐姐為什麼我們全班都叫我葛二蛋?t t 我一口飯沒嚥下去,心...