python爬取電影top存入HTML檔案

2021-08-24 18:11:30 字數 1754 閱讀 3481

當我們在進行爬蟲的時候!會選擇多種儲存顯示方式!這次我們簡單的例項一下(需要一點html基礎)

關於html布局推薦**     ,需要在同步資料夾裡新增css檔案,html引入

py檔案**

from lxml import etree

import requests

import json

from urllib.request import urlretrieve

url = ''

req = requests.get(url).text

# print(req)

# print(type(req))

data= json.loads(req)

# print(data['result']['movie'])

movie_name_list= #電影名

movie_release_date= #上映時間

movie_starring= #主演

movie_picture= #海報

movie_score= #評分

for x in data['result']['movie']:

# print(x)

# print(x['movie_name'])#電影名

id電影上映時間

電影名主演

評分 ''')

f.close()

for y in range(0,len(movie_name_list)):

with open('movie.html','a',encoding='utf-8')as f:

f.write(

''+'\n'

''+str(y)+''+'\n'

''+''+''+'\n'

''+movie_release_date[y]+''+'\n'

''+movie_name_list[y]+''+'\n'

''+movie_starring[y]+''+'\n'

''+movie_score[y]+''+'\n'

''+'\n'

)f.close()

with open('movie.html','a',encoding="utf-8")as f:

f.write('''

''')

f.close()

html**

主要新增****

建立好**之後才好向裡面新增東西

結果

上圖只是基礎的html**,對著方面有研究的大佬們,可以選擇盡情美化!!!!!

爬取貓眼電影存入mongodb

from urllib import request import time import re import pymongo class maoyanspider object def init self self.baseurl self.headers 爬取頁數計數 self.page 1 s...

python爬取豆瓣電影top250

簡要介紹 爬取豆瓣電影top250上相關電影的資訊,包括影片鏈結 影片名稱 上映時間 排名 豆瓣評分 導演 劇情簡介。使用 requests etree xpath 1 檢視網頁資訊,確定爬取的內容,建立資料庫 class spiderdata peewee.model url peewee.cha...

python爬取貓眼電影top100

最近想研究下python爬蟲,於是就找了些練習專案試試手,熟悉一下,貓眼電影可能就是那種最簡單的了。1 看下貓眼電影的top100頁面 分了10頁,url為 我們發起請求,得到相應 我們我使用的是requests庫,這是乙個第三方的庫。2 利用正則解析爬取下的頁面 當然你也可以使用xpath和bs4...