今天解決了程式卡住不動的問題:
通過設定urllib2.urlopen(url,none,time_out)中time_out的值,來排除連線超時的錯誤。
time_out = xtry:
data = #data為遞交表單
req = urllib2.request(url,data)
res = urllib2.urlopen(req,none,time_out)
except:
print 'connect again!'
main()
並且深入學習了 beautifulsoup這個模組的使用,解決了亂碼,學會了篩選多重標籤提取元素的方法。
如果想要查詢屬性值未知的標籤,
比如這樣
可以這樣寫,用true來代替所有未知或者變化的屬性值
soup.find(name = "tag",attrs=)
並且,在beautifulsoup裡也可以嵌入正規表示式:
比如遇到這樣的標籤:
我們就可以:
list = soup.findall(name = "h1" ,attrs = )
這樣就可以獲得到:
hello world 123
hello world 456
hello world 789
一天一點學linux
隨著linux應用的擴充套件許多朋友開始接觸linux,根據學習windwos的經驗往往有一些茫然的感覺 不知從何處開始學起。就像是戰爭,你有勇氣戰勝一切敵人,但你的眼前一片 漆黑,你知道前面有很多敵人,但就不知道具體的位置,無從下手。所以認清方向,確定目標很重要。下面就說說學習linux的一些建議...
一天一點學linux
隨著linux應用的擴充套件許多朋友開始接觸linux,根據學習windwos的經驗往往有一些茫然的感覺 不知從何處開始學起。就像是戰爭,你有勇氣戰勝一切敵人,但你的眼前一片 漆黑,你知道前面有很多敵人,但就不知道具體的位置,無從下手。所以認清方向,確定目標很重要。下面就說說學習linux的一些建議...
2012 4 16 一天一總結
呵呵 先笑一會兒,傻傻的 今天是自己計畫的第一天,還算勉強通過吧,好吧 開始總結 第一 星期一是乙個很尷尬的一天,第二 上午主要是做布局,乙個感受 好的布局真的很賞心悅目啊,不知道自己何時能高更高一步,寫出美的布局,慢慢來,加油 第三 下午主要在上午做的布局上進行一些修改,然後用到了spinner,...