附一下**:
具體說一下步驟:
1.安裝python
2.安裝selenium
win鍵 + r 執行 cmd , 在cmd裡輸入 pip install selenium
測試一下能不能用,開啟idle,新建乙個檔案:
from selenium import webdriver
browser = webdriver.chrome()
browser.get('')
4.**執行
# coding=utf-8
import requests, re
from selenium import webdriver
url = ''
browser = webdriver.chrome()
while true:
# download the page
print("forward to page %s ..." % url)
browser.get(url)
elem = browser.find_element_by_tag_name('h3')
# get the url of the for the next page
print(elem.text)
number = re.findall("\d+", elem.text)
if number == :
print('the end.')
#browser.quit()
break;
else:
url = '' + number[0] # 拼接新位址
黑板客爬蟲闖關筆記 4 5關
第四關在第三關的基礎上多了以下兩點 1 網頁響應時間增加。要想快速找到密碼就需要多執行緒 2 強密碼,100位的密碼按位置隨機出現,需要抓取網頁不同位置密碼,再組合起來。解題過程 第一次 失敗 我發現password列表共13頁,所以我以為只要將列表中不重複的位置的值加到乙個list中。再將list...
黑板客爬蟲闖關第二關
這一關相比第一關反而更容易,因為不需要進行複雜的正則判斷,只需要用迴圈嘗試密碼即可。這裡需要用到requests的post請求,並在請求裡加上使用者名稱和密碼即可。coding utf 8 import requests wrongnotify 您輸入的密碼錯誤,請重新輸入 website inde...
黑板客爬蟲闖關第二關
檢視原始碼 post傳輸的內容名 username,password.根據題目要求,範圍在30之內,while 迴圈即可,沒必要雙迴圈 且passeord提示輸入的是數字,直接用i即可,不用 coding utf 8 import urllib2 import urllib import re i ...