1.建立乙個新專案:
scrapy startproject myproject
2.在新專案中建立乙個新的spider檔案:
scrapy genspider mydomain mydomain.com
mydomain為spider檔名,mydomain.com為爬取**網域名稱
3.全域性命令:
startproject
genspider
settings
runspider
shell
fetch
view
version
4.只在專案中使用的命令(區域性命令):
crawl
check
list
edit
parse
bench
5.執行spider檔案:
scrapy crawl
6.檢查spider檔案有無語法錯誤:
scrapy check
7.列出spider路徑下的spider檔案:
scrapy list
scrapy edit
相當於開啟vim模式,實際並不好用,在ide中編輯更為合適。
scrapy fetch
10.將網頁內容儲存下來,並在瀏覽器中開啟當前網頁內容,直觀呈現要爬取網頁的內容:
scrapy view
11.開啟 scrapy 顯示臺,類似ipython,可以用來做測試:
scrapy shell [url]
12.輸出格式化內容:
scrapy parse [options]
13.返回系統設定資訊:
scrapy settings [options]
如:$ scrapy settings --get bot_name
scrapybot
14.執行spider:
scrapy runspider
15.顯示scrapy版本:
scrapy version [-v]
後面加 -v 可以顯示scrapy依賴庫的版本
16.測試電腦當前爬取速度效能:
scrapy bench
scrapy常用命令
scrapy startproject myfirst 建立乙個爬蟲專案 strapy startproject logfile tmp scrapy.log myfirst scrapy fetch 用例顯示爬蟲爬去的過程 scrapy runspider first.py 可以使用runspid...
Scrapy常用命令
1,新建乙個工程 scrapy startproject spider name 2,檢視當前專案內有多少爬蟲 scrapy list 3,view使用瀏覽器開啟網頁 scrapy view 4,startproject 語法 scrapy startproject 這個命令是scrapy最為常用的...
scrapy 常用命 令
原文 終端命令建立乙個專案 scrapy startproject name 利用蜘蛛名建立乙個py檔案 scrapy genspider name domain.name 在終端執行 scrapy shell url 得到response 利用蜘蛛名進行相對應的執行 scrapy crawl na...