let requests =
require
('requests'
)//傳送http請求
//[具體詳情](
let fs =
require
('fs'
)//檔案系統
//[具體詳情](
let path =
require
('path'
)//路徑
//[新增鏈結描述](
const cheerio =
require
('cheerio'
)//在nodejs中類似jq的$符號
//[具體詳情](
requests()
.on('data'
,function
(chunk)
const $ = cheerio.
load
(chunk)
eval($
('#getareastat').
html()
) fs.
writefile
(path.
resolve
(__dirname,
'data.json'),
json
.stringify
(window.getareastat),(
)=>)}
)
eval函式可以把字串當做js來執行
在使用爬蟲時要按照資料結構適當更改**
爬蟲要謹慎使用!
使用nodejs爬取靜態網頁資料
嘗試來做乙個爬蟲的教程,很大概率是乙個系列教程,分為靜態頁面,動態頁面,無頭瀏覽器 三個方向開始 主要是分享一下,也算是自己記乙個筆記吧,我們來找乙個靜態的 找個比較有意義的 爬取濟南的boos直聘列表資訊 首先宣告的是boos直聘擁有一部分的反扒,高頻次的訪問會要求輸入驗證碼,這次教程不會寫,之後...
nodeJs爬取網頁資料
發現node可以爬蟲,正好我在找暑期實習,然後就使用node爬一下 資料找實習。爬取目標 載入http模組 目標 嘿嘿,這個 有很多實習職位 http的get請求乙個目標 函式的引數是response,繫結兩個事件,乙個 data 事件,會不斷觸發獲取資料,資料獲取完觸發 end 事件。爬到的的資料...
nodejs 爬取小說
前段時間看到有個同學用python爬取了 於是打算用nodejs爬取一下 在這裡先總結一下整個過程.僅供學習,請勿商業 類似jquery的乙個庫 const cheerio require cheerio 檔案管理模組 const fs require fs 控制併發數 const async re...