想著把我csdn上所有部落格的markdown原始檔備份一遍,但其實沒學過這方面的東西,就做了個半成品。。。以後完善吧(應該)
實現了提取所有文章的名字與其對應文章id和發布時間,並找到編輯文件的網頁。
上面這些資訊提取很方便,網頁原始碼裡翻就找得到。
然後按照檔名與日期給每一篇文章建立每乙個空資料夾。
但是最關鍵的一步是,我不知道怎麼提取每一篇.md檔案。。。
渲染好的已經發布的文字我不要,我要.md原始檔。只有編輯文字的時候遇得到md檔案,所以就得實現模擬瀏覽器登陸。。。然而並不會做。。。
是文章的編輯頁面,(開啟來可以是markdown編輯器也可以是傳統的那個),傳統的編輯器的原始碼裡倒是可以看到帶樣式的每個字,但是md編輯器的原始碼裡面就沒有。。。
半成品**:
#coding=utf-8
'''created on 2023年8月19日
@author: xienaoban
@github:
@blog:
'''import os
import urllib
######
######
######
######
######
######
######
######
######
######
######
######
#def log(str):
print("log: " + str + ".")
######
######
######
######
######
######
######
######
######
######
######
######
##引數設定
auth = "xienaoban"
wsp = "c:\\users\\xjf19\\desktop\\"
######
######
######
######
######
######
######
######
######
######
######
######
#s = urllib.request.urlopen("" + auth).read().decode('utf-8')
pages = ord(s[s.find("尾頁") - 3]) - ord('0') + 1
fout = open(wsp + "articles.txt",'w', encoding='utf-8')
log(str(pages) + " page(s) found")
key = "+ auth + "/article/details/"
key2 = "link_postdate"
edit = ""
articles = 0
for page in range(1, pages):
url = "" + auth + "/article/list/"+str(page)
sc = urllib.request.urlopen(url).read().decode('utf-8')
i = 0
while
true:
tmp = sc.find(key, i)
if(tmp < i): break
i = tmp + len(key)
fout.write(edit)
while sc[i]!='\"':
fout.write(sc[i])
i += 1
i += 12
d = sc.find(key2, i) + len(key2) + 2
fout.write(" " + sc[d]+sc[d+1]+sc[d+2]+sc[d+3] + sc[d+5]+sc[d+6] + sc[d+8]+sc[d+9])
ed = sc.find("",i) - 22
while i != ed:
if sc[i] !='/'
and sc[i] != '*'
and sc[i] != '?': fout.write(sc[i])
i += 1
fout.write("\n")
articles += 1
fout.close()
log(str(articles) + " article(s) found")
fin = open(wsp + "articles.txt", "r", encoding='utf-8')
wsp += "blog\\"
ifnot os.path.exists(wsp): os.mkdir(wsp)
new_dir = 0
for arti in range(0, articles):
line = fin.readline()
ifnotline: break
line = line[len(edit) + 4 + 8:-1]
ifnot os.path.exists(wsp + line):
os.mkdir(wsp + line)
new_dir += 1
log(str(new_dir) + " directory(s) added")
log("program finished")
######
######
######
######
######
######
######
######
######
######
######
######
#
RBAC在CSD下的參考實現
許可權模組是mis系統中不可或缺的重要組成。員工在進行正常的訪問前,伺服器往往都需要認證員工的身份。確認員工是否授權,也就是進行訪問控制。訪問控制管理允許被授權的主體 個體或團體組織 對某些資源的訪問,同時拒絕向非授權的主體提供服務。許可權模組的邏輯模型一般形式如下 誰 員工 角色 對什麼 應用模組...
python實現檔案的備份
現實生活中很多檔案需要備份,這裡寫一下用python程式實現檔案的備份。提示輸 件 oldfilename input 請輸 要拷 的 件名字 table of contents 應 1 製作 件的備份 11 以讀的 式開啟 件 oldfile open oldfilename,rb 提取 件的字尾...
python指令碼實現檔案備份
本指令碼通過判斷是否為周一來執行完全備份或增量備份,需提前放到計畫任務中每天執行,實現周一完全備份,之後每天增量備份的功能.具體 實現如下 root bin python from time import strftime import os import tarfile import hashli...