最近在利用python寫寫爬蟲玩,起初就是覺得好玩,可以隨意爬取網頁上的所需要的資訊,其次正好可以鞏固下剛剛學完的python。
python作為最簡單的一門計算機語言,我用了兩天時間入門,掌握了其基本的語法,及其相關的特殊用法。確實,python是我學過的語言中最為輕鬆易學,且簡單易懂的一門高階語言。
目前已經可以將整個的網頁給爬取下來,但是現在遇到乙個問題,就是在某些需要登入的**上,我用的data好像沒用。後來知道是有些**禁止使用爬蟲,之後我就用header偽裝成瀏覽器訪問,解決部分問題。但是還是沒法實現登入。
#coding=utf-8
import urllib2
import urllib
url = ''
headers =
values = {}
values['username'] = "***"
values['password'] = "***"
data = urllib.urlencode(values)
request = urllib2.request(url,data,headers) #server request
page = urllib2.urlopen(request).read().decode('utf-8')
print page
#賬號,密碼我用**表示
更新日誌 售後CP更新日誌
記錄一下 售後cp更新日誌 2015 02 28 11 51 更新內容 1 版本公升級,框架公升級,框架公升級版本3.1.2.3 2 功能公升級,工作流斷開後可以自動重連。2014 10 10 14 03 更新內容 1 功能公升級,研發工單在填寫工作日誌時同步更新order task關聯表。2 可顯...
系統更新日誌
20161116 jquery.validate required 必選字段 remote 請修正該欄位 email 電子郵件驗證 url 驗證 date 日期驗證 dateiso 日期 iso 驗證 datede number 數字驗證 numberde digits 只能輸入整數 creditc...
foobox更新日誌
2021 11 22,6.1.6.8 版 公升級主程式到 foobar2000 v1.6.8 漢化版 asion 細微調整優化.2021 11 06,6.1.6.7 版 final 公升級主程式到 foobar2000 v1.6.7 漢化版 asion 編碼器及執行環境檔案,安裝包體積有所增大.分組...