1.顯示編碼問題
有時候當我們使用爬蟲爬取網頁源**時,因為編碼格式的不同導致亂碼
例如 www.4399.com
網頁源**
我們可以看出4399的編碼格式指定為 gb2312
而 pycharm 預設的編碼格式是 utf-8
所以當我們獲取源**時,漢字就會出現亂碼
import requests
url=''
response=requests.get(url)
print(response.text)
輸出結果如下
出現亂碼
2.解決問題
只需要指定 pycharm 改變當前編碼格式
**如下
import requests
url=''
response=requests.get(url)
response.encoding='gb2312'
print(response.text)
輸出結果如下
亂碼問題解決了
Python爬蟲系列
部落格 python,爬蟲 由於近來學 lan 業 ai 繁 fa 忙 zuo 快乙個月沒有更新部落格了。這周完成了兩門課的結課考試,現下時間開始變得充裕。準備梳理一下前段時間學習的關於python爬蟲的內容,權當複習鞏固知識。而初次學習時遇到的疑難雜症,那時候的應對策略是抓大放下,在這梳理過程會下...
格雷編碼(python實現)
題目描述 格雷編碼是乙個二進位制數字系統,在該系統中,兩個連續的數值僅有乙個位數的差異。給定乙個代表編碼總位數的非負整數 n,列印其格雷編碼序列。格雷編碼序列必須以 0 開頭。示例 1 輸入 2 輸出 0,1,3,2 解釋 00 0 01 1 11 3 10 2 對於給定的 n,其格雷編碼序列並不唯...
格雷編碼python實現
格雷編碼是乙個二進位制數字系統,在該系統中,兩個連續的數值僅有乙個位數的差異。給定乙個代表編碼總位數的非負整數 n,列印其格雷編碼序列。格雷編碼序列必須以 0 開頭。示例 1 from typing import list class solution def graycode self,n int...