爬蟲管理平台以及wordpress本地搭建

2022-01-10 11:39:30 字數 1770 閱讀 6768

各爬蟲管理平台了解

各爬蟲管理平台的本地搭建

windows下的wordpress搭建

scrapydweb:

用於scrapyd實施管理的web應用程式,支援scrapy日誌分析和視覺化
gerapy:

基於scrapy,scrapyd,scrapyd-client,scrapyd-api,django和vue.js的分布式爬蟲管理框架
crawlab:

基於golang的分布式爬蟲管理平台,支援多種程式語言以及多種爬蟲框架.
注意:前兩個框架的搭建基於scrapyd,如果不知道怎麼配置可以看我之前寫的部落格:

scrapydweb搭建:

gerapy

crawlab:(配置安裝官方給的很詳細,這裡簡單說下)

docker(入門簡單,推薦)

kubernetes(多機器部署,推薦)

直接部署(理解原理)

開發模式(開發除錯)

多節點部署

#個人選擇docker,該專案配置環境過多,怕給本地造成衝突

docker的安裝:

安裝環境:本地虛擬化以及hyper-v需要開啟,如圖所示

wampserver軟體

wordpress原始碼

開啟wampserver.exe,預設安裝(注意在安裝路徑的時候不能有中文資料夾)

最後會有四個彈窗:

安裝完成後,點選桌面圖示執行,程式顏色表示狀態

綠色後,單機程式圖示,點選localhost進入網頁

將預先準備的wordpress安裝包放到wampserver/www資料夾下

點選開始進入配置頁面:

上面配置先放置,我們先進行資料庫設定

輸入使用者名稱root,密碼空,點選執行。

進入賬戶下的root,修改許可權,修改密碼

我們需要對應之前的資料庫名稱(wordpress),所以新建資料庫

提交進入登陸介面配置:

填寫完成進入登陸介面

​登陸:前後臺介面

Scrapy爬蟲 十 爬蟲總結以及擴充套件

本專題介紹了scrapy的框架原理,並用了5個例項由淺入深的進行了演示。還講到了scrapy的除錯技巧,對於入門scrapy爬蟲應該有一定的幫助。對url的分析主要是找規律,應為開發 的開發者為了框架化或者說偷懶,一般同型別內容的url都有一定的規律,比如imdb.cn的 url的規律簡直是太簡單了...

專案管理平台

專案管理平台 一套構建b s架構專案的管理平台,包含三個子系統 專案管理系統,使用者及許可權管理系統,使用者個人中心系統。其中,專案管理系統是平台的核心子系統,平台依託專案管理系統自實現。平台截圖如下 專案管理系統介紹 功能模組 1 專案管理 子系統管理,子系統選單管理 2 資料庫管理 資料庫管理,...

ELKF管理平台

elkf管理平台 版本內容 作者修訂 時間v1.0 安裝部署和驗證 葉琴方初稿 20190627 elkf管理平台是cloud服務的一部分。在測試服elkf管理平台中,filebeat在192.168.3.212的測試服docker應用伺服器上安裝,logstash elasticsearch ki...