爬取武漢大學教務系統資料

2021-07-29 09:09:12 字數 1293 閱讀 5452

#coding:utf-8

__author__ = 'zy'

import urllib2

import cookielib

import urllib

import requests

import re

import sys

'''模擬登入'

''captchaurl = ""

posturl = ""

# 驗證碼位址和post位址

# 將cookies繫結到乙個opener cookie由cookielib自動管理

username = '?'

password = '?'

# 使用者名稱和密碼

picture = opener.open(captchaurl).read()

# 用openr訪問驗證碼位址,獲取cookie

# 儲存驗證碼到本地

secretcode = raw_input('輸入驗證碼: ')

# 開啟儲存的驗證碼 輸入

postdata =

# 根據抓包資訊 構造表單

headers =

# 根據抓包資訊 構造headers

data = urllib.urlencode(postdata)

# 生成post資料 ?key1=value1&key2=value2的形式

request = urllib2.request(posturl, data, headers)

# 構造request請求

#try:

response = opener.open(request)

result = response.read().decode('gb2312')

# 由於該網頁是gb2312的編碼,所以需要解碼

print result

# 列印登入後的頁面

# 利用之前存有cookie的opener登入頁面

爬取學校教務系統學生課表

爬取課表在指令碼的完成下顯得十分簡單 一 在開啟南郵研究生教務 是登入一下,並開啟chrome的審查元素的network發現 登入時請求的url和所提交表單的資料email和assword 二 在開啟課表查詢的頁面是我們發現 有乙個儲存為excel檔案的button,我點開發現 瀏覽器向這個url發...

爬取正方教務系統課程表

被乙個學長布置下的任務 有些地方可能不夠完整 思路 首先你需要完成登入操作 1 首先根據教務系統 的審查元素,發現了乙個驗證碼的 其中 xh 是 學號 xm 是學生姓名的url編碼 gnmkdm是課程表頁面的 這些資訊是獲得課表頁面的學生資訊,會顯示出你是 的學生,學號是什麼,專業是什麼等等之類的 ...

Python 北京交通大學研究生教務系統爬蟲

本來想嘗試自己爬一下全部學生的成績,結果發現實在是弄不到賬號密碼,就此作罷。萬一有學弟學妹以後想嘗試可以參考。import urllib import urllib2 import requests import re student 八位學號 password 密碼 postdata urllib...