Scrapy環境搭建

win7系統下搭建scrapy環境:

以我電腦f盤建立的venv為例 → 1.cd venv 2.cd scripts 3.activte/deactivate (進入/退出虛擬環境) 4.cd ../.. 5.pip install c:\users\administrator\desktop\twisted-18.4.0-cp36-cp36m-win32.whl 6.pip install scrapy 這樣便搭建好了scrapy的基礎環境了

twisted安裝包傳送門

以我爬取的豆瓣網為例 1.scrapy startproject movie . 2.scrapy genspider movie --template=crawl 這樣便建立好了你的第乙個scrapy爬蟲了

1.scrapy crawl movie 開始爬取** 2.scrapy crway movie -o result.json 生成json格式

scrapy的整體框架如下:

attention: 使用scrapy的乙個小坑 –>

報錯：debug: filtered offsite request to…

官方對這個的解釋，是你要request的位址和allow_domain裡面的衝突，從而被過濾掉。可以停用過濾功能。

request1 = scrapy.request(url=url, callback=self.parse_content, dont_filter=true) dont_filter=true即可解決.

官方文件(中文)

官方教程(英文)

jasonding的學習scrapy入門

young-hz 的scrapy研究探索系列

Scrapy環境搭建

scrapy環境搭建

Scrapy環境搭建

ubutun 搭建scrapy環境

Scrapy環境搭建

scrapy環境搭建

Scrapy環境搭建

ubutun 搭建scrapy環境

相關推薦