第一次python部落格,僅作紀念。
import requests
import re
from bs4 import beautifulsoup
requests庫從網上獲取資源,re/bs4 庫,用來提取需要的資訊。
開啟要爬取的**:」右擊檢視其源**, 找到感興趣的內容,如下
2023年01月12日 星期日 己亥年臘月十八
今日天氣:蘇州市,多雲,氣溫2℃~7℃,西北風1級,當前溫度3℃。
定義乙個get_html()函式從網路獲取資源,並提取感興趣的內容並返回,**如下所示
def get_html()
: #模擬瀏覽器,防止請求被拒絕
url=
''headers=
#獲取網路內容
r=requests.
get(url,headers=headers)
r.raise_for_status()
r.encoding =
'utf-8'
data=r.text
#用beautiful庫解析
soup=
beautifulsoup
(data,
'html.parser'
) temp=soup.p.string
#替換temp=temp.
replace
(','
,'.'
) temp=temp.
replace
(','
,'.'
) #將字串分割,分割符號為"."
,其結果為列表型別
lst=temp.
split
('.'
)return lst
def read_write
(lst)
:with
open
('.\\weather.txt'
,'w+'
)as f:
for it in lst:
it=it +
'\n'
f.write
(it)
print
(it)
其實沒必要定義乙個專門呼叫的函式,只是為了看著舒服。成了,
操作就這麼簡單。
def main()
: lst=
get_html()
read_write
(lst)
main
()
Python簡單爬蟲(爬取天氣資訊)
初學python,學到python爬蟲時在網上找資料,發現找到的大部分都是前部分內容對運作方式介紹,然後就直接上 了,這樣對像我一樣的小白來說比較困難,的注釋較少,部分 塊沒有詳細說明運作方式和具體作用,所以寫此筆記方便別人和自己以後進行學習檢視。作業系統window python2.7.10 wi...
python 爬取天氣
準備工作做好了,接下來就是 了 用py爬天氣資訊,需要使用兩個模組,分別是urllib2 獲取資料 和json 解析資料 coding utf 8 import urllib2 import json from city import city cityname raw input 你想查哪個城市的...
爬取某地全年天氣資訊
coding utf 8 created on sat apr 11 13 36 42 2020 author zan import requests import json import pandas as pd import re from bs4 import beautifulsoup he...