上來先貼位址,剛入門的可以來van啊:
0x00 第一關
怕不是個迴圈,獲取網頁中的數字不斷加到url中,驗證猜想,繼續試一試:
那就把原來的數字換掉:
妙啊:
這裡基本確定思路,獲取網頁內的數字,然後在將數字加入url進行迴圈提交
檢視原始碼,確定獲取的資訊標籤內,並使用re庫匹配我們要的數字
import跑起來:requests
from bs4 import
beautifulsoup
import
redef
gethtmltext(url):
try:
r = requests.get(url, timeout = 30)
r.raise_for_status()
return
r.text
except
:
return
''def
getnum(html):
soup = beautifulsoup(html, '
html.parser')
h3 = soup.find('h3'
).text
num = re.findall(r'\d'
,h3)[0]
return
numdef
main():
start_url = '
'num = 39642
while
num:
url = start_url +str(num)
html =gethtmltext(url)
(html)
num =getnum(html)
main()
0x01 第二關
初步斷定post兩個引數,用for迴圈遍歷30前的數字爆破密碼
先抓個包,看看兩個引數名叫啥
密碼錯誤'in
h3:
(html)
defmain():
url = '
'for i in range(31):
(i) kv =
html =gethtmltext(url, kv)
getcontent(html)
main()
吼吼吼,成功遼
黑板客爬蟲闖關第二關
這一關相比第一關反而更容易,因為不需要進行複雜的正則判斷,只需要用迴圈嘗試密碼即可。這裡需要用到requests的post請求,並在請求裡加上使用者名稱和密碼即可。coding utf 8 import requests wrongnotify 您輸入的密碼錯誤,請重新輸入 website inde...
黑板客爬蟲闖關第二關
檢視原始碼 post傳輸的內容名 username,password.根據題目要求,範圍在30之內,while 迴圈即可,沒必要雙迴圈 且passeord提示輸入的是數字,直接用i即可,不用 coding utf 8 import urllib2 import urllib import re i ...
Python 黑板客爬蟲闖關的第一關
附一下 具體說一下步驟 1.安裝python 2.安裝selenium win鍵 r 執行 cmd 在cmd裡輸入 pip install selenium 測試一下能不能用,開啟idle,新建乙個檔案 from selenium import webdriver browser webdriver...