scrapy爬蟲框架使用教程2

2021-09-28 12:07:36 字數 1210 閱讀 7401

下文中提到的所有命令,均是在shell(俗稱黑視窗或命令列中)輸入的

當你已經搭建好python開發環境,並且安裝好scrapy框架後,就可以開始乙個爬蟲專案了(新建專案命令如下)

scrapy startproject myfirstproject

#此命令缺省會在當前目錄下建立乙個名為myfirestproject專案資料夾

命令格式如下 scrapy startproject 專案名稱 專案存放的位置(可選的)

如果看到如下內容說明許可權不夠,解決方法(windows下可以按windows鍵加x 選擇window powershell (管理員),linux下可以使用root使用者,重新執行一次即可)
traceback (most recent call last)

: file

....

....

.with

open

(dst,

'wb'

)as fdst:

permissionerror:

[errno 13

] permission denied:..

.

看到如下內容說明專案建立成功了
c:\users\blues>scrapy startproject myfirstproject

new scrapy project 'myfirstproject'

, using template directory

'c:'..

....

, created in

: c:\users\blues\myfirstproject

you can start your first spider with

: cd myfirstproject

scrapy genspider example example.com

專案的目錄結構如下

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-mp**2apj-1570697254404)( 「專案結構」)]

具體每個檔案的詳細用處可以參閱此處

至此乙個爬蟲專案就建立好了,是不是非常簡單

scrapy爬蟲框架

作者經過幾周的python爬蟲實踐之後,深入學習了一下scrapy這個爬蟲框架,現將一些基本知識和 總結整理一下,以備後查。2.scrapy的命令列使用 這部分網上很多部落格都有總結,不需要背,理解會用主要的命令 startproject crawl fetch list genspider.即可,...

scrapy 爬蟲框架

1.安裝 公升級pip版本 pip install upgrade pip 通過pip安裝scrapy框架 pip install scrapy 安裝成功 只執行scrapy 進行測試是否安裝成功 2.scrapy startproject 爬蟲專案名稱 執行此命令,可以生成乙個爬蟲專案 會預先生成...

Scrapy爬蟲框架

scrapy中的各大元件及其功能 1.scrapy引擎 engine 引擎負責控制資料流在系統的所有元件中流動,並在相應動作發生時觸發事件。2.排程器 scheduler 排程器從引擎接收request並將它們入隊,以便之後引擎請求request時提供給引擎。4.spider。spider是scra...