爬取武漢大學教務系統資料

#coding:utf-8
__author__ = 'zy'
import urllib2
import cookielib
import urllib
import requests
import re
import sys
'''模擬登入'
''captchaurl = ""
posturl = ""
# 驗證碼位址和post位址
# 將cookies繫結到乙個opener cookie由cookielib自動管理
username = '？'
password = '？'
# 使用者名稱和密碼
picture = opener.open(captchaurl).read()
# 用openr訪問驗證碼位址,獲取cookie
# 儲存驗證碼到本地
secretcode = raw_input('輸入驗證碼： ')
# 開啟儲存的驗證碼 輸入
postdata = 
# 根據抓包資訊 構造表單
headers = 
# 根據抓包資訊 構造headers
data = urllib.urlencode(postdata)
# 生成post資料 ?key1=value1&key2=value2的形式
request = urllib2.request(posturl, data, headers)
# 構造request請求
#try:
response = opener.open(request)
result = response.read().decode('gb2312')
# 由於該網頁是gb2312的編碼，所以需要解碼
print result
# 列印登入後的頁面
# 利用之前存有cookie的opener登入頁面

爬取學校教務系統學生課表

爬取課表在指令碼的完成下顯得十分簡單一在開啟南郵研究生教務是登入一下，並開啟chrome的審查元素的network發現登入時請求的url和所提交表單的資料email和assword 二在開啟課表查詢的頁面是我們發現有乙個儲存為excel檔案的button，我點開發現瀏覽器向這個url發...

爬取正方教務系統課程表

被乙個學長布置下的任務有些地方可能不夠完整思路首先你需要完成登入操作 1 首先根據教務系統的審查元素，發現了乙個驗證碼的其中 xh 是學號 xm 是學生姓名的url編碼 gnmkdm是課程表頁面的這些資訊是獲得課表頁面的學生資訊，會顯示出你是的學生，學號是什麼，專業是什麼等等之類的 ...

Python 北京交通大學研究生教務系統爬蟲

本來想嘗試自己爬一下全部學生的成績，結果發現實在是弄不到賬號密碼，就此作罷。萬一有學弟學妹以後想嘗試可以參考。import urllib import urllib2 import requests import re student 八位學號 password 密碼 postdata urllib...

爬取武漢大學教務系統資料

爬取學校教務系統學生課表

爬取正方教務系統課程表

Python 北京交通大學研究生教務系統爬蟲

相關推薦