python高階檔案和爬蟲

2021-08-20 08:06:46 字數 1415 閱讀 1254

檔案後續

轉換文字:分辨檔案的編碼格式

num = open(r'c:\users\悠然\desktop\練字\python.txt','r+',encoding='gbk')

text = num.read()

print(text)

如圖:

迴圈讀 以行為單位

num = open(r'c:\users\悠然\desktop\練字\新建文字文件.txt','r+',encoding='gbk')

text = num.readline()

while len(text)!=0:

print(text,end='')

#再讀取一行  下一行

text = num.readline()

如圖:

複製 並替換

foo = open(r'c:\users\悠然\desktop\練字\python.txt','r+',encoding='gbk')

num = open(r'c:\users\悠然\desktop\練字\python2.txt','w+',encoding='gbk')

lines = foo.readlines()

print(lines)

for li in lines:

num.write(li.replace('哈哈哈','***'))

num.close()

foo.close()

print("複製 並替換完畢")

如圖:

小小爬蟲

from urllib import request

請求開啟乙個網頁

response = request.urlopen('')

在本地 建立乙個文字

xml = open('python_xml.html','w+',encoding='utf-8')

把伺服器的相應 處理

html = response.read()

xml.write(str(html.decode('utf-8')))

print('讀取完畢')

如圖:

圖二:

完畢!

Python爬蟲(入門 高階)

講解方式 針對每乙個 或專題進行詳細深入的專項講解 課程亮點 具體的 資料抓取的案例和常見爬蟲問題的專項解答 課程內容 python爬蟲熱點專案,由多個 資料抓取的案例和常見問題專項解答組成 適用人群 1 希望未來從事爬蟲或反爬蟲方向工作的程式設計師。2 正在從事爬蟲工作,但對目前職業有進一步提公升...

python爬蟲基礎(3)爬蟲高階知識

cookie是指 為了鑑別使用者身份,進行繪畫跟蹤而儲存在客戶端本地的資料。本來的含義是指有始有終的一系列動作,而在web中,session物件用來在伺服器儲存特定使用者會話所需要的屬性及資訊。cookie和session他們不屬於http協議範圍,由於http協議無法保持狀態,但實際情況,我們有需...

python爬蟲高階 SVG對映反爬蟲

破解svg加密的字元,得到正確的字元 練習平台 一 svg的具體表現 二 css檔案 三 svg 四 舉例詳解 這裡選擇圖一為例 已知 類名 vhkjj4 座標 316px 141px 取正整數則為 316,141 可以自行選擇其他類名進行嘗試 usr bin env python coding u...