10001:請求引數異常,請公升級客戶端後重試
mac 在terminal 先其中乙個終端,不要關閉
之後在python檔案中正常編寫:
先來乙個測試檔案:
# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.chrome.options import options
chrome_options = options()
chrome_options.add_experimental_option("debuggeraddress", "127.0.0.1:9222")
chrome_driver = "chromedriver.exe"
driver = webdriver.chrome(chrome_options=chrome_options)
print(driver.title)
driver.get("")
# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.chrome.options import options
import urllib
from urllib import parse
from xml.sax.saxutils import unescape,escape
import datetime,time
# default header
default_request_headers =
login_header =
config_setting =
class login_zhihuspider():
name = "zhihu"
start_urls = ['']
allowed_domains = ['www.zhihu.com']
headers = default_request_headers
# 每個問題獲取遍歷多少個答案
username = config_setting['account_username']
password = config_setting['account_password']
cookies = {}
chrome_options = options()
chrome_options.add_experimental_option("debuggeraddress", "127.0.0.1:9222")
def start_requests(self):
records =
item = {}
driver = webdriver.chrome(chrome_options=self.chrome_options)
print(driver.title)
url = ""
driver.get(url)
netloc = parse.urlparse(url).netloc
print(netloc)
if self.username != '':
driver.find_element_by_xpath("//*[@name='username']").send_keys(self.username)
if self.password != '':
driver.find_element_by_xpath("//*[@name='password']").send_keys(self.password)
input('請在瀏覽器上登陸後,按任意鍵開始:')
print("測試環節,建議手動在除錯瀏覽器輸入賬號密碼,看能否成功")
##driver.close()
# 翻頁請求問題相關
if __name__ == "__main__":
login_zhihuspider().start_requests()
在終端應用程式選擇chrome圖示,右鍵選擇顯示包內容:
具體點選操作如下:
contents >> macos >> 即可見到google chrome
再把這個可見的圖示,拖到terminal終端,即可看見全路徑
chrome remote debugging from another machine - stack overflow]
【python】抓取直湖選鹽列熱名單示例,爬取,知乎,鹽選,專欄,熱榜,例項]
super262/spiderzhihu: a crawler for zhihu (
HttpClient 模擬登陸知乎
最近做爬蟲相關工作,我們平時用httpwebrequest比較多,每乙個url都要建立乙個httpwebrequest例項,而且有些 驗證比較複雜,在登陸及後續抓取資料的時候,每次請求需要把上次的cookie傳遞給這次請求。記得這篇部落格 結尾,dudu總結了 httpclient最與眾不同的地方是...
python模擬登陸知乎
恢復內容開始 在完成前面的階段的任務之後,我們現在已經能夠嘗試著去模擬登入一些 了。在這裡我們模擬登入一下知乎做一下實驗。筆者在這裡總共用了三天多的時間,下面給大家分享一下筆者是怎麼一步一步的模擬登入成功的。也希望大家能夠吸取我的教訓。初步的模擬登入 下面這段 是筆者最初寫的,我們慢慢來看 impo...
Python 爬蟲模擬登陸知乎
在之前寫過一篇使用python爬蟲爬取電影天堂資源的部落格,重點是如何解析頁面和提高爬蟲的效率。由於電影天堂上的資源獲取許可權是所有人都一樣的,所以不需要進行登入驗證操作,寫完那篇文章後又花了些時間研究了一下python模擬登陸,網上關於這部分的資料很多,很多demo都是登陸知乎的,原因是知乎的登陸...