首先我問題和一樣,
**為
# -*-coding:utf-8-*-
import requests
from bs4 import beautifulsoup
movie_list =
def get_movies():
'chrome/57.0.2987.133 safari/537.36','host':'movie.douban.com'}
for i in range(0,10):
link = '' + str(i)
r = requests.get(link,headers = headers,timeout = 10)
print str(i),"頁面相應狀態",r.status_code
soup = beautifulsoup(r.text,'lxml')
div_list = soup.find_all('div',class_= 'hd')
# 注意!calss 後面一定要加「_」因為calss本身也是預設的函式
for each in div_list:
movie = each.a.span.text
return movie_list
get_movies()
print movie_list
for i in movie_list:
print i
結果為
發現字串在python內部的表示是unicode編碼,於是加入了encode(『utf-8』)
如下:
# -*-coding:utf-8-*-
import requests
from bs4 import beautifulsoup
movie_list =
def get_movies():
'chrome/57.0.2987.133 safari/537.36','host':'movie.douban.com'}
for i in range(0,10):
link = '' + str(i)
r = requests.get(link,headers = headers,timeout = 10)
print str(i),"頁面相應狀態",r.status_code
soup = beautifulsoup(r.text,'lxml')
div_list = soup.find_all('div',class_= 'hd')
# 注意!calss 後面一定要加「_」因為calss本身也是預設的函式
for each in div_list:
movie = each.a.span.text.encode('utf-8')
return movie_list
get_movies()
print movie_list
for i in movie_list:
print i
結果如下:
printstr(i),"頁面相應狀態",r.status_code
soup = beautifulsoup(r.text,'lxml')
div_list = soup.find_all('div',class_='hd')
# 注意!calss 後面一定要加「_」因為calss本身也是預設的函式
foreachindiv_list:
movie = each.a.span.text.encode('utf-8')
returnmovie_list
get_movies()
jieguo = json.dumps(movie_list,encoding='utf',ensure_ascii=false)
printjieguo
foriinjieguo:
printi
執行結果如下;
但還是有個問題,列印每個元素的時候沒列印一行就會換行,這個問題我目前解決不了
Sublime Text 輸入中文顯示方框問號亂碼
用了sublime text 2好久,今天遇到這個問題,網上很難找到相關的解決方案,因此被困擾了很久,故此記錄下來以備再次發生。問題描述 在重灌系統前一切正常,重灌系統後沒有再次安裝sublime text 2直接執行安裝路徑下的sublime text.exe,當輸入中文符號時就出現了如下圖所示的...
python中文列表輸出
python 2.x版本的中文編碼一直是乙個頭疼的事,這裡主要解決中文列表或者字典的中文輸出列印 usr bin env python coding utf 8 import json dic print dic 轉化成json輸出 print json.dumps dic,encoding utf...
python 列表 元組 達內筆記
一 列表 1 變數中存的是乙個資料 12是數,1.23是數,hello這個詞不是數,這三個都是資料 2 列表裡面存的是多個資料,通常單獨使用每個資料 3 列表定義和使用 對比 變數名 資料 列表名 資料1,資料2,取資料 把元素拿出來用或計算或看 列表名 下標 注意 下標從0開始,只能是整數,最大是...