view code
1**很簡單沒什麼好說的,主要就是正則匹配和亂碼問題。#!/usr/bin/env python2#
coding=utf-8
3import
urllib
4importre5
defgethtml(url):
6 page =urllib.urlopen(url)
7 html =page.read()
8page.close()
9return
html
10def
getweather(html):
11 reg = '
(.*?).*?(.*?).*?(.*?)'
12 weatherlist =re.compile(reg).findall(html)
13return
weatherlist
14 getml = gethtml('
')15 list_all =getweather(getml)
16for i in
list_all:
17print i[0],i[1],i[2]18#
for item in i:19#
print item
抓下來的頁面是utf-8的 但是由於findall返回的是列表 如果直接輸出列表 列表中有字串的話會有亂碼。
試過先轉unicode再轉gb2312也不可以。i.decode(『utf-8′).encode(『gb2312′)
單個輸出就沒問題了。
執行截圖
python天氣預報
1.引入requests import requests def query now 查詢實時天氣 return none query city input 請輸入要查詢的城市名稱 2.準備url位址 url query city 3.發請求,接收資料 response requests.get u...
Python天氣預報採集器(網頁爬蟲)
python是一門很強大的語言,在實現爬蟲方面也十分方便。爬蟲簡單說來包括兩個步驟 獲得網頁文字 過濾得到資料。1 獲得html文字。python在獲取html方面十分方便,寥寥數行 就可以實現我們需要的功能。1 defgethtml url 2 page urllib.urlopen url 3 ...
Flex 天氣預報
效果如下截圖 建立乙個flex專案weather 在weather.mxml中新增乙個httpwebservice如下 result onresult event resultformat e4x 定義乙個onresult函式如下 bindable private var xml xml new x...