使用爬蟲獲取ajax資料

-簡單修改了一下url 可以獲取到前100條資料

from urllib import request
import json
class
doubanmoviespide
:"""
豆瓣電影劇情片排行榜
"""def__init__
(self)
:        self.url =
""self.headers =
defload_page
(self)
:"""
載入頁面，獲取json資料
"""try:
req = request.request(self.url, headers=self.headers)
response = request.urlopen(req)
html = response.read(
).decode(
)# print(type(html))     # > 
self.parse_page(html)
except exception as e:
print
("load_page error:{}"
.format
(e))
defparse_page
(self, html)
:"""
解析html頁面，實際上就是提取json資料
"""try:
text = json.loads(html)
movie_list =
for t in text:
rating = t[
'rating'][
0]rank = t[
'rank'
]                title = t[
'title'
]                movie_info =
self.write_info(movie_list)
except exception as e:
print
("parse_page error:{}"
.format
(e))
defwrite_info
(self, movie)
:"""
將提取出來的json資料儲存到json檔案中
"""with
open
("../text/doubanmovie.json"
,'w'
, encoding=
"utf-8"
)as f:
f.write(json.dumps(movie, ensure_ascii=
false))
print
("write success"
)if __name__ ==
"__main__"
:    dbm = doubanmoviespide(
)    dbm.load_page(
)

[,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,, ,,,,

,]

scrapy爬蟲獲取Ajax請求

本次練習為智聯招聘網，要先註冊登入。傳送門看到ajax 登入 f12 network xhr f5 preview 展開result，可以看到很多的招聘資料，這就是我們需要的。現在開始寫一建立scrapy專案。scrapy startproject crawposition 二使用pych...

ajax的使用及資料的獲取

在寫ajax之前，先複習一下form表單。首先form表單的主要功能是用來向服務端提交資料的，其屬性有action，method，enctype,等。1，action屬性是提交的路徑伺服器的路徑 uri.url統一資源定位，uri專案內部的資源定位 2，method屬性其屬性值主要有兩個 po...

ajax 資料的獲取

responsetext ajax請求返回的內容就被存放到這個屬性下面 readystate屬性請求狀態 0 初始化還沒呼叫open 方法 1 載入已呼叫send 方法，正在傳送請求 2 載入完成 send 方法完成，已收到全部響應內容 3 解析正在解析響應內容 4 完成響應內容解析完成，...

使用爬蟲獲取ajax資料

scrapy爬蟲獲取Ajax請求

ajax的使用及資料的獲取

ajax 資料的獲取

相關推薦