基礎爬蟲知識入門-01
#匯入模組
import urllib.request
#爬取的目標網頁
file
= urllib.request.urlopen(
"")#讀取全部網頁,file.readline讀取行
data =
file
.read(
)print
(data)
#開啟路徑,wb表示以二進位制方式寫入
)#write方法寫入資料
fhandle.write(data)
fhandle.close(
)
補充說明
其他更快捷的方式:使用urlretrieve方法
filename=urllib.request.urlretrieve(「」,filename=「d:/baidu.html」),但是urlretrieve會有資料快取,使用urllib.request.urlcleanup()方法可以清除快取。
urllib補充:
#file.info環境資訊,file.getcode獲取狀態碼,file.geturl獲取爬取的鏈結
#當鏈結含有中文或者其他字元時,可以使用urllib.request.quote進行編碼,使用urllib.request.quote(「鏈結」),使用urllib.request.unquote()解碼。
演算法入門 day01
1 2019中,包含2 0 1 9的數的和 package 2019 author seh date 2020 12 23 9 22 version 1.0 1 2019中,包含2 0 1 9的數的和 boolean contains str 檢測字串內有無包含str的內容 public class...
python學習筆記 Day 01
回憶並複述是加強記憶的好方式!python3的所有常用語法 物件導向程式設計思維 運用模組進行程式設計 遊戲程式設計 計算機 是乙個 python shell,shell 的意思就是 外殼 乙個通過鍵入文字與程式互動的途徑!像我們 windows 那個 cmd 視窗,像 linux 那個黑乎乎的命令...
python之基礎學習day01
今天是python學習的第一天,收穫還是不少的,使用的編輯器為python3.7。第一天學習知識總結 1 編寫的第一句python語句 print hello world 2 python的兩種執行方式 python直譯器 py檔案路徑 python進入直譯器 實時輸入並獲取到執行結果 3 pyth...