資料的分類:
非結構化的資料:html等
處理方式:正規表示式,xpath
結構化資料:json,xml
處理方法:轉換為python資料型別
json是一種輕量級的資料交換結構
,他使得人們很容易進行閱讀和編寫,同時方便了機器進行解析和生成。適用於進行資料交換場景
,比如**前台與後台之間的資料互動。
json資料存在手機版的網頁,因此查詢時需要將網頁改為手機版
1. json.loads()
把json格式字串解碼轉換成python物件 從json到python的型別轉化對照如下:
json.loads(strdict) # json資料自動按unicode儲存
# 2. json.dumps()實現python型別轉化為json字串,返回乙個str物件 把乙個python物件編碼轉換成json字串
從python原始型別向json型別的轉化對照如下:
# 注意:json.dumps() 序列化時預設使用的ascii編碼
# 新增引數 ensure_ascii=false 禁用ascii編碼,按utf-8編碼
# chardet.detect()返回字典, 其中confidence是檢測精確度
json.dumps(dictstr)
# ''
chardet.detect(json.dumps(dictstr))
# print json.dumps(dictstr, ensure_ascii=false)
# chardet.detect(json.dumps(dictstr, ensure_ascii=false))
# 切換到手機模式,尋找型別為json的資料型別,在response中查詢有沒有想要的電影標題
找到後我們找到請求**
通過get方法訪問:
#encoding:utf-8
import requests
import json
from pprint import pprint
url = "j/search_subjects?type=movie&tag=%e7%83%ad%e9%97%a8&page_limit=100&page_start=1"
response = requests.get(url)
ret1 = response.json() #轉換方法1
ret2 = json.loads(response.content)
pprint(ret2) #通過pprint()格式化輸出
python JSON模組使用
最近在使用有道api翻譯的時候發現,json處理字典資料的時候出現問題,因此想要學習一下json的用法 json.loads import json 用於將python的資料轉化為json的資料形式,語法json.dumps obj,skipkeys false ensure ascii true ...
python json模組使用示例
1 簡介 json 標準化 序列化 的資料格式,幾乎所有語言都支援的一種資料介面格式,在python中,json可以方便地用來序列化常規的資料型別 字典,集合,列表等 也可以序列化類的例項等,但比較麻煩。json序列化後的資料,可讀性好,人能夠識別。2 序列化到記憶體物件 及 從記憶體反序列化的兩種...
python json模組簡單使用
介紹python中處理json資料的乙個模組的簡單使用 json.dumps 用於將python dict物件轉換為json字串,返回轉換後的json字串 import json a b json.dumps a print a,type a print b,type b json.dump 用於將...