我以為scarpy就是個簡單的庫,安裝後直接import scrapy就行了,執行的時候報錯…import scrapy…attributeerror: module 『scrapy』 has no attribute 『spider』,我還很奇怪為什麼他不報錯:no module named scrapy。網上說import scrapy,寫法太舊,讓換成from scrapy.spider import spider
,還有說版本太老,更新scrapy等等,但好像我的並沒有那樣…折騰半天,原來是我的專案裡我自己建了乙個名稱裡有scarpy的這樣乙個檔案,改名就行,順便說一說怎麼執行scarpy。
想要執行scrapy有兩種方法,一種是在本地電腦的終端跳轉到scrapy專案的資料夾(跳轉方法:cd+資料夾的路徑名),然後輸入命令列:scrapy crawl ***
(***是你爬蟲工程的名字)。
另一種執行方式需要你在最外層的大資料夾裡新建乙個main.py檔案(與scrapy.cfg同級)。
裡面寫入
from scrapy import cmdline
#匯入cmdline模組,可以實現控制終端命令列
cmdline.execute(['scrapy','crawl','***'])
#用execute()方法,輸入執行scrapy的命令,(***是你爬蟲工程的名字)
然後執行,***工程就執行了 爬蟲的框架 Scarpy
1 新建scrapy專案 進入專案目錄,按住shift,選擇windows powershell,在彈出的視窗輸入 scarpy startproject 專案名 2 新建爬蟲案例 在新建的專案根目錄中,按住shift,選擇windows powershell,在彈出的視窗輸入 scrapy gen...
Scarpy爬蟲框架入門
1 python環境,這裡我使用的是python3.6,建議不要使用該版本之後的版本,因為後面還需要安裝對應python版本的pywin32程式,而該程式暫時沒有python3.6後面的對應版本。2 scrapy 框架,這個直接使用pip install 進行安裝就行。3 對應python版本的py...
python 爬蟲 報錯 求救
在找到某度文庫文件的js檔案鏈結後想用json.loads 進行解析 以上為鏈結的js 檔案 import json import re deffetch url url headers session requests.session return session.get url,headers ...