1. windows+r開啟
cmd命令列工具,
cd desktop
進入到桌面目錄
2. 輸入建立專案命令 scrapy startproject 專案名
3. cd 到 專案目錄下
cd專案名
4. 執行建立爬蟲的命令 scrapy genspider 爬蟲名 爬蟲起始**
5. 使用pycharm開啟專案,檢視專案目錄結構
6. 啟動爬蟲,找到pycharm自帶的命令列工具
輸入啟動爬蟲命令 scrapy crawl 爬蟲名
(例如:
jobs),
回車即可
ps:可以使用另外一種方式以
debug
模式啟動爬蟲,可以斷點除錯
6.1 新建乙個
py檔案,例如
debug.py,
在該檔案中寫入以下**,右鍵
debug
執行即可使用斷點除錯
6.2修改robots協議
建立scrapy專案
1.選擇合適的資料夾,在pycharm中的terminal中輸入 scrapy startproject spider,建立爬蟲專案spider。2.執行命令後,得到乙個名為spider的資料夾,檔案結構如下 3.進入專案根目錄 cd spider 4.建立爬蟲檔案agri.py scrapy ge...
scrapy的安裝,scrapy建立專案
簡要 scrapy的安裝 1 pip install scrapy i 國內源 一步到位 2 報錯1 building twisted.test.raiser extension error microsoft visual c 14.0 is required.get it with micros...
Scrapy(三)建立專案
建立專案是爬取內容的第一步,之前已經講過,scrapy通過scrapy startproject命令來在當前目錄下建立乙個新的專案。下面我們建立乙個爬取 文章資訊的專案 scrapy startproject cnblog 其中cnblog是你的專案的名字,可以自己定義。其目錄結構如下 cnblog...