#!/usr/bin/python2.7# -*- coding:utf-8 -*-
# 2017-10-19
"""12306 搶票
網頁分析
- 檢視網頁原始碼
- 判斷是否通過非同步載入或者框架的形式接收並展示資料
- 資料加密過,然後前端再通過js解密並展示(即js混淆)
urllib2.urlerror: 證書作用:保證資料在傳輸的過程中不會被篡改或擷取
"""import sys
reload(sys)
sys.setdefaultencoding('utf8')
import ssl
import json
import urllib2
# 跳過證書驗證
if tmp_list[23] == u'有':
elif tmp_list[23] == u'無' or not tmp_list[23]:
elif int(tmp_list[23]) > 0:
else:
爬取12306火車票車次等資訊(python)
本例子中將爬取相應日期的車次資訊到資料庫中,用的是postgresql資料庫 import requests import json from bs4 import beautifulsoup import psycopg2 開啟資料庫並登陸 db psycopg2.connect host loc...
python 爬取12306驗證碼
import ssl import urllib2 i 1import time while 1 不加的話,無法訪問12306 time.sleep 1 有時需要加延時,以防被封。i i 1 f.write data f.close 以下就是爬取的 的截圖 12306的驗證碼經常讓人眼花繚亂,眼睛仔...
Python爬取X車之家配置資訊
x車之家的配置資訊主要運用css3的偽類反爬,需要將正確值替換掉原來的類值就可以了。獲取所有車系的id seriesid 存入csv 獲取所有車系的介面 每個車系對應有不同的具體車的id specid 存入csv 大約有38500個車每個車系對應的所有車的specid資訊介面 配置資訊的頁面url ...