筆者在寫xx爬蟲的時候,需要獲取頁面請求返回的json資料中的某些資料,遇見如下的"key":value("id":value)或者是"key":"value"("ratedate":"value")區別在於value是否帶引號,並且需要獲取相應的value值,筆者通過正則快速解決
1、"key":value("id":value)型別
主要關注點在於正則部分
page = 1
param =
# 偽裝火狐
kv =
response = requests.get(url, params=param, headers=kv)
data = response.text
#通過正則獲取"id":value列表
datalist = re.findall(r'\"id\":.*?(?=,)', data)
#列印datalist
print(datalist)
列印結果如下
獲取list中的value如下
text =
for i in range(20):
#將datalist[i]加入到list列表中
#利用split 用:符號進行切分
listid = re.split(':',text[i][3])
itemid = listid[1]
print(itemid)
#每次獲取的值就是value了
2、"key":"value"("ratedate":"value")型別
datalist2 = re.findall(r'\"ratedate\":\".*?\"', data)
print(datalist2)
列印結果如下
獲取list中的value如下
for i in range(20):
#可以觀察以上是以"分隔開因為三個"是注釋,所以需要\"進行轉義,所以可以利用split進行切分,因為切分的結果在list中
times = text[i][0]
print(times)
#列印結果就是value值了
python 利用正規表示式獲取IP位址
例 import re test mynetact 0,1,10.10.0.9 pattern re.compile r d d d d 正規表示式,匹配ip位址 print pattern.findall test 獲取ip位址 執行結果 10.10.0.9 在字串中找到正規表示式所匹配的所有子串...
獲取網路的json檔案 Gson解析json檔案
獲取網路的json檔案 param url return throws clientprotocolexception throws ioexception public static string getjsondata string url throws clientprotocolexcept...
利用Python獲取系統當前時間
取得時間相關的資訊的話,要用到python time模組,python time模組裡面有很多非常好用的功能,你可以去官方文件了解下,要取的當前時間的話,要取得當前時間的時間戳,時間戳好像是1970年到現在時間相隔的時間。你可以試下下面的方式來取得當前時間的時間戳 import time print...