import requests
# 爬取陽光電影
html = requests.get(
"")print
(html.text)
執行發現,列印亂碼
href
='/html/gndy/jddy/20160320/50541.html'
>
imdbæà·ö8·ö×óóòó°æ¬400óಿa
>
/>
href
='/html/gndy/jddy/20200627/60172.html'
>
2020äêﲾ硶ôã¸â×éñ¯/²»á¼âéa
>
/>
href
='/html/gndy/dyzz/20200627/60171.html'
>
2019äê»ñ½±¾ççéòôàö¡¶ãû·äóëa
>
/>
href
='/html/gndy/dyzz/20200627/60170.html'
>
2019ä궯×÷ôöäñ¡¶¼«ïþìóéú¡·ba
>
/>
href
='/html/gndy/jddy/20200627/60169.html'
>
2008äê¸ß·öðüò顶ïóòéèëxµäï×a
>
/>
href
='/html/gndy/jddy/20200627/60168.html'
>
2020äê¿æ»ãðüò顶»úðµ»æ¤¡·ha
>
/>
href
='/html/gndy/jddy/20200627/60167.html'
>
2020äê¿æ»ãðüò顶»úðµ»æ¤¡·ha
>
/>
href
='/html/gndy/jddy/20200627/60166.html'
>
2020äêææ»ã¡¶ïéêéææì·/×½ïé¼ça
>
/>
href
='/html/gndy/jddy/20200626/60164.html'
>
2020äê¾ççé·¸×¶ñãû/äï·½ö®a
>
/>
怎麼解決呢?網上答案很多,很容易誤導有說設定utf-8的;這裡我要跟大家講的是方法,首先我們需要檢視**是什麼編碼,這個時候用會用到charset我們發現charset=gb2312
這個時候我們只需要新增一行html.encoding = "gb2312"
即可
import requests
# 爬取陽光電影
html = requests.get(
"")html.encoding =
"gb2312"
print
(html.text)
解決request亂碼的方法
第一種直接在web.xml加上過濾器,簡單粗暴 characterencodingfilter org.springframework.web.filter.characterencodingfilter encoding utf 8 forceencoding true 第二種用 1實現handl...
Python爬蟲 Request模組
文章說明了request模組的意義,且強調了request模組使用更加方便。接下來介紹幾種常用的request操作,並且會在後續補充說明一些特定用法。匯入檔案 import requests一 請求 右邊為請求語句,返回值為response回應 r requests.get r requests.p...
解決request中文亂碼的問題
解決request中文亂碼的問題 request.setcharacterencoding charset 必須寫在第一次使用request.getparameter 之前,這樣才能保證引數是按照已經設定的字元編碼來獲取。response.setcharacterencoding charset 必...