#coding:utf-8
__author__ = 'zy'
import urllib2
import cookielib
import urllib
import requests
import re
import sys
'''模擬登入'
''captchaurl = ""
posturl = ""
# 驗證碼位址和post位址
# 將cookies繫結到乙個opener cookie由cookielib自動管理
username = '?'
password = '?'
# 使用者名稱和密碼
picture = opener.open(captchaurl).read()
# 用openr訪問驗證碼位址,獲取cookie
# 儲存驗證碼到本地
secretcode = raw_input('輸入驗證碼: ')
# 開啟儲存的驗證碼 輸入
postdata =
# 根據抓包資訊 構造表單
headers =
# 根據抓包資訊 構造headers
data = urllib.urlencode(postdata)
# 生成post資料 ?key1=value1&key2=value2的形式
request = urllib2.request(posturl, data, headers)
# 構造request請求
#try:
response = opener.open(request)
result = response.read().decode('gb2312')
# 由於該網頁是gb2312的編碼,所以需要解碼
print result
# 列印登入後的頁面
# 利用之前存有cookie的opener登入頁面
爬取學校教務系統學生課表
爬取課表在指令碼的完成下顯得十分簡單 一 在開啟南郵研究生教務 是登入一下,並開啟chrome的審查元素的network發現 登入時請求的url和所提交表單的資料email和assword 二 在開啟課表查詢的頁面是我們發現 有乙個儲存為excel檔案的button,我點開發現 瀏覽器向這個url發...
爬取正方教務系統課程表
被乙個學長布置下的任務 有些地方可能不夠完整 思路 首先你需要完成登入操作 1 首先根據教務系統 的審查元素,發現了乙個驗證碼的 其中 xh 是 學號 xm 是學生姓名的url編碼 gnmkdm是課程表頁面的 這些資訊是獲得課表頁面的學生資訊,會顯示出你是 的學生,學號是什麼,專業是什麼等等之類的 ...
Python 北京交通大學研究生教務系統爬蟲
本來想嘗試自己爬一下全部學生的成績,結果發現實在是弄不到賬號密碼,就此作罷。萬一有學弟學妹以後想嘗試可以參考。import urllib import urllib2 import requests import re student 八位學號 password 密碼 postdata urllib...