Python 利用正則獲取json中不同的資料型別

2021-08-26 05:51:29 字數 1280 閱讀 6635

筆者在寫xx爬蟲的時候,需要獲取頁面請求返回的json資料中的某些資料,遇見如下的"key":value("id":value)或者是"key":"value"("ratedate":"value")區別在於value是否帶引號,並且需要獲取相應的value值,筆者通過正則快速解決

1、"key":value("id":value)型別

主要關注點在於正則部分

page = 1

param =

# 偽裝火狐

kv =

response = requests.get(url, params=param, headers=kv)

data = response.text

#通過正則獲取"id":value列表

datalist = re.findall(r'\"id\":.*?(?=,)', data)

#列印datalist

print(datalist)

列印結果如下

獲取list中的value如下

text = 

for i in range(20):

#將datalist[i]加入到list列表中

#利用split 用:符號進行切分

listid = re.split(':',text[i][3])

itemid = listid[1]

print(itemid)

#每次獲取的值就是value了

2、"key":"value"("ratedate":"value")型別

datalist2 = re.findall(r'\"ratedate\":\".*?\"', data)

print(datalist2)

列印結果如下

獲取list中的value如下

for i in range(20):

#可以觀察以上是以"分隔開因為三個"是注釋,所以需要\"進行轉義,所以可以利用split進行切分,因為切分的結果在list中

times = text[i][0]

print(times)

#列印結果就是value值了

python 利用正規表示式獲取IP位址

例 import re test mynetact 0,1,10.10.0.9 pattern re.compile r d d d d 正規表示式,匹配ip位址 print pattern.findall test 獲取ip位址 執行結果 10.10.0.9 在字串中找到正規表示式所匹配的所有子串...

獲取網路的json檔案 Gson解析json檔案

獲取網路的json檔案 param url return throws clientprotocolexception throws ioexception public static string getjsondata string url throws clientprotocolexcept...

利用Python獲取系統當前時間

取得時間相關的資訊的話,要用到python time模組,python time模組裡面有很多非常好用的功能,你可以去官方文件了解下,要取的當前時間的話,要取得當前時間的時間戳,時間戳好像是1970年到現在時間相隔的時間。你可以試下下面的方式來取得當前時間的時間戳 import time print...