python爬蟲人人網登陸

2021-08-23 12:40:45 字數 1900 閱讀 1503

#匯入模組

from urllib import request,parse 

from http import cookiejar

#儲存cookie,例項化cookie
cookie = cookiejar.cookiejar() 

.com/plogin.do』

#登入賬號密碼
data = 

#轉換格式
data = parse.urlencode(data)

req = request.request(url,data=bytes(data,encoding=』utf-8』))

response = opener.open(req)

print(response.read().decode(『utf-8』))

#匯入模組
from urllib import request,parse 

import json

#通過物件儲存cookie
cookie =cookiejar.cookiejar()
#######handeler對應著乙個操作

#######opener 遇到有cookie的response的時候,

#######呼叫handler內部的乙個函式, 儲存到cookie

opener = request.build_opener(handler)

#######登入時抓到的login url

#######新增form表單

form =

#轉換bytes型別
form_bytes = parse.urlencode(form).encode(『utf-8』) 

print(form_str)

#opener.open代替request.urlopen
response = opener.open(url,form_bytes)

html = response.read()

print(html)

#######json轉換字典

res_dict = json.loads(html.decode(『utf-8』))

#獲取home的url鏈結
home_url =res_dict[『homeurl』]

print(home_url)

#開啟網頁
req = opener.open(home_url)

print(req.read().decode(『utf-8』))

1、json.dumps()和json.loads()是json格式處理函式(可以這麼理解,json是字串)
(1)json.dumps()函式是將乙個python資料型別列表進行json格式的編碼(可以這麼理解,json.dumps()函式是將字典轉化為字串)

(2)json.loads()函式是將json格式資料轉換為字典(可以這麼理解,json.loads()函式是將字串轉化為字典)

2、json.dump()和json.load()主要用來讀寫json檔案函式

人人網登陸

from tuozhan all import get 0.url 1.構造headers 2.呼叫get函式 3.儲存頁面 url headers html bytes get url,headers headers with open renren.html wb as f f.write ht...

人人網form登陸

from day1.tuozhan all import post,get import json from urllib import request,parse 儲存cookie 通過物件儲存cookie cookie object cookiejar.cookiejar handler 對應著...

Python爬蟲模擬登陸豆瓣

coding utf 8 import requests,re from pil import image class doubanspider object def init self self.session requests.session def login self,username,pa...