百度貼吧發貼機探索(一)

2021-04-12 14:22:43 字數 637 閱讀 4023

工作也籤了,沒啥事做。。。

突然想研究一下**自動登陸的問題,決定做點有挑戰性的事情搞個有驗證碼的試試。呵呵~~

經過一晚上的分析實驗,終於有點眉目了,趕緊寫下來。

大概原理是這樣的:

一、使用httpwebrequest 和httpwebresponse 。從stream中獲得html**

三、post資料。這裡要注意post中文的話要注意編碼,不然會出現亂碼

然後分析其他相關的字段,一起write到stream中

問題:1.不穩定,有的時候可以成功,有的時候不行。懷疑是發貼時間有限制,或者其他限制,有待研究。。。

2.關於post後的返回狀態沒有檢測,可能會獲得不能發貼的錯誤原因。主要分析返回的html中的錯誤描述。

3.貼吧的驗證碼是直接儲存在hidden標籤中的,如果要加上cookies驗證呢?恩,有待考慮。。。

相關引數:

//驗證碼直接儲存在html中了,呵呵。。

oh~~my god 睡覺了~~~~明天繼續

python百度貼吧發帖簽到 百度貼吧簽到指令碼

本指令碼為我從網上各渠道蒐集到的簽到指令碼的雜交 如果不需要日誌則把帶 日誌記錄 的行刪除即可 from requests import session from time import time 日誌記錄 start time time 資料 log path f e data sign log ...

百度貼吧爬蟲

encoding utf 8 import urllib.request import urllib.parse import time import random def load page url 通過url來獲取網頁內容jfa param url 待獲取的頁面 return url對應的網頁內...

爬取百度貼吧

import urllib.request import urllib.parse import os,time 輸入貼吧名字 baname input 請輸入貼吧的名字 start page int input 請輸入起始頁 end page int input 請輸入結束頁 不完整的url ur...