今天學了會python爬蟲,走的是福利路線(mzitu.com)
爬蟲還是很順利的,但是儲存福利圖的時候遇到了很多困難
需求就是根據網頁標題來建立資料夾儲存當前網頁的h圖
首先網頁標題獲取的時候特意用
type(title)看了一下,是unicode,為了實現過濾某些字元,比如"?"之類的需要用str.replace()
但是直接
str(title)是不可以的,所以要在爬蟲**最前加入
import之後在windows建立資料夾,以標題為資料夾名sysreload(sys)
sys.setdefaultencoding(
'utf-8
')
自己試出來了,轉utf-8即可
path = str(title).strip().decode('於是get√utf-8')
os.makedirs(os.path.join(
"d:\mzitu
", path))
oschdir(
"d:\mzitu\\
" + path)
![](https://pic.w3help.cc/2ed/7f3b188cd0b700818e36248ded5b8.jpeg)
python2 7換行 Python2 7基礎語法
1.建立檔案xx.py usr bin python3 print hello,world 2.linux下執行 python hello.py 3.編碼 預設字串unicode 設定編碼 coding utf 8 4.識別符號 第乙個字元必須是字母表中字母或下劃線 識別符號的其他的部分有字母 數字...
python2 7是什麼 python2 7是什麼
pyton2.7是python在2010年發布的乙個版本。python 是乙個高層次的結合了解釋性 編譯性 互動性和物件導向的指令碼語言,具有很強的可讀性,相比其他語言經常使用英文關鍵字,其他語言的一些標點符號,它具有比其他語言更有特色語法結構。下面來解釋一下python這門語言 python是一種...
python2 7中文編碼 python2 7
我從外部api中獲得了乙個字串 u4ece u8d77 u70b9 u5411 u6b63 u5357 u65b9 u5411 u51fa u53d1,u884c u9a76170 u7c73,u76f4 u884c u8fdb u5165 u4e2d u5173 u6751 u4e1c u8def...