假定有這麼個場景,爬蟲爬取的資料以json格式儲存,即像python字典的字串。
1#-*- coding=utf-8 -*-
2import
json
3importre4
importos5
6#包含多個字典的列表
7 movie_dict_list =[
8 ,
9 ,
10 ,
11 ,
12 ,
13 ]
1415
#將字典寫入json格式的檔案
16 with open('
f:/movie.json
','wb
') as file:
17for movie_dict in
movie_dict_list:
18 file.write(json.dumps(movie_dict,ensure_ascii=false) + '\n'
)1920#
movie.json
21'''
'''52
535455#
將json中的unicode字串轉換為str,(遞迴的把list和dict裡的unicode物件encode成str。)56#
def byteify(input):57#
if isinstance(input, dict):58#
return 59#
elif isinstance(input, list):60#
return [byteify(element) for element in input]61#
elif isinstance(input, unicode):62#
return input.encode('utf-8')63#
else:64#
return input
656667#
將json檔案轉為python字典,逐行讀取,應對大檔案
68 f = open('
f:/movie.json
','rb')
69 movie_dict_list =
70for line in
f:71 movie_a_line =json.loads(line)
7273
#題外話,假如上面將字典寫入json檔案時未新增禁用ascii碼 ,那麼json檔案將以unicode字串儲存,74#
需要呼叫byteify函式,將json檔案中的unicode字串轉換為python的str75#
movie_a_line = byteify(json.loads(line))
7677
78f.close()
7980
#提取字典中的某乙個鍵作為檔名
81for movie_dict in
movie_dict_list:
82 folder = '
f:/test_dict_to_folder/
' + movie_dict.get('
movie_director')
83if
notos.path.exists(folder):
84os.mkdir(folder)85#
正則用於剔除windows檔名中的非法字元
刪除無限巢狀資料夾
正在學習計算機網路的知識,用typora做筆記,突然感覺電腦變卡,連瀏覽器都打不開,開啟任務管理器發現typora的cpu佔用率高達50 發現不正常。一開始還以為是typora的問題,後來發現,我的筆記檔案,計算機網路.md 放在了桌面上,其對應的資源檔案 計算機網路.assets資料夾 也放在了桌...
資料夾 Python自動整理資料夾
以下是具體的 name 自動把指定目錄下的檔案進行整理 author 唐朝品鑑 date 2020年8月25日 description 自動把指定目錄下的檔案進行整理,根據字尾名自動建立資料夾,並把對應的檔案移動到對應資料夾中 import os from os import path 以下是具體的...
資料夾文件目錄生成
先解決第乙個內容 檔案在 這個有幾種辦法,我覺得最快速 形象和直觀的辦法是使用dos語句中的tree命令來實現文件生成,具體步驟如下 win r 開啟執行欄,輸入 cmd 輸入 tree 檢視tree命令的用法,可以看到非常詳細的說明 c users lucky tree 以圖形顯示驅動器或路徑的資...