Scrapy爬蟲與Mysql資料庫之間的連線

2021-09-26 00:15:54 字數 726 閱讀 7910

1.需要導的包

import pymysql
2.# mysql連線資訊(字典形式)

db_config =
3.# 獲得資料庫連線

connection = pymysql.connect(**db_config)
try:

# 獲得資料庫游標(游標提供了一種對從表中檢索出的資料進行操作的靈活手段,就本質而言,游標實際上是一種能從包括多條資料記錄的結果集中每次提取一條記錄的機制。游標總是與一條sql 選擇語句相關聯因為游標由結果集(可以是零條、一條或由相關的選擇語句檢索出的多條記錄)和結果集中指向特定記錄的游標位置組成。)

with connection.cursor() as cursor:

sql = 'insert into ******book(title, url) values(%s, %s)'

for u in urls:

# 執行sql語句

cursor.execute(sql, (u.string, r''+u.attrs['href']))

# 事務提交

connection.commit()

finally:

# 關閉資料庫連線

connection.close()

```5.連線資料庫成功,並得到資料

scrapy爬蟲問題items與pipelines

scrapy爬蟲問題items與pipelines 問題描述 在爬蟲py檔案裡寫了兩次yield item 兩個item內容不同 在pipelines分別寫了兩個與item對應的pipeline,item傳輸的資料只能進入優先順序高的pipeline。解決 因為item傳輸的資料會傳給每個pipel...

scrapy框架爬蟲流程與介紹

學習scrapy框架的網上教材 1.scrapy 的基礎概念 二 整體架構 爬取流程 上圖綠線是資料流向,所有的操作都是圍繞著scrapyengine進行操作的,也就是說 scrapyengine處理指揮著整個框架 引擎開啟乙個 open adomain 找到處理該 的spider並向該spider...

爬蟲scrapy的使用與安裝

一.什麼是scrapy?二.安裝 linux pip3 install scrapy windows a.pip3 install wheel www.lfd.uci.edu gohlke pythonlibs twisted 17.1.0 cp35 cp35m win amd64.whl d.pi...