中國圖書網裡面計算機類別的書籍資料,並存入csv檔案
選取**: www.bookschina.com/kinder/27000000/
前面的步驟都一樣,這裡主要不一樣的是主要檔案和pipeline檔案
1、編寫items檔案
class doubanbookitem(scrapy.item):
# define the fields for your item here like:
# name = scrapy.field()
name = scrapy.field()
author = scrapy.field()
price = scrapy.field()
2、編寫bookmain檔案進行html的解析處理
# 在當前元素下獲取子元素標籤
item["name"] = price.xpath(".//h2[@class='name']/a/text()").extract()[0]
item["author"] = price.xpath(".//a[@class='author']/text()").extract()[0]
item["price"] = price.xpath(".//span[@class='sellprice']/text()").extract()[0]
yield item # 必須要設定的3、pipeline 執行寫入檔案操作
class doubanbookpipeline:
def process_item(self, item, spider):
with open("d:/book.csv", "a", encoding='utf-8') as fp:
fp.write(
item["name"] + ',' + item["author"] + ',' + item["price"] + '\n')
Python簡單爬蟲匯出CSV檔案
流程 模擬登入 獲取html頁面 正則解析所有符合條件的行 逐一將符合條件的行的所有列存入到csvdata臨時變數中 寫入到csv檔案中 核心 寫入csv檔案中 with open self.csvfilename,wb as csvfile spamwriter csv.writer csvfil...
python網路爬蟲 資料儲存之CSV
csv comma separated values,逗號分隔值 是儲存 資料的常用檔案格式。很多應用都支援csv格式,因為它很簡潔,下面就是乙個csv檔案的例子 fruit,cost banana,0.30 pear,1.25 python的csv庫可以非常簡單地修改csv檔案,甚至從零開始建立乙...
python爬蟲簡單 python爬蟲 簡單版
學過python的帥哥都知道,爬蟲是python的非常好玩的東西,而且python自帶urllib urllib2 requests等的庫,為爬蟲的開發提供大大的方便。這次我要用urllib2,爬一堆風景。先上重點 1 response urllib2.urlopen url read 2 soup...