1、beautifulsoup 解析庫
2、mongodb 儲存庫
3、requests-html 請求庫
beautifulsoup
1、什麼bs4,為什麼要使用bs4?
是乙個基於re開發的解析庫,可以提供一些強大的解析功能。
提高提取資料的效率與爬蟲開發效率。
2、在c盤建立乙個data/db資料夾
- 資料的存放路徑
3、mongod啟動服務
進入終端,輸入mongod啟動mongodb服務。
4、mongo進入mongodb客戶端
開啟乙個新的終端,輸入mongo進入客戶端
二 資料庫操作
資料庫操作:
切換庫:
sql:
use admin; 有則切換,無則報錯。
mongodb:
use tank; 有則切換,無則建立,並切換tank庫中。
查資料庫:
sql:
show databases;
mongodb:
show dbs;
顯示的資料庫若無資料,則不顯示。
刪除庫:
sql:
drop database
mongodb:
db.dropdatabase()
集合操作: mysql中叫做表。
建立集合:
sql:
create table f1, f2...
mongodb:
# 在當前庫中通過.來建立集合
db.student
插入資料:
# 插入多條資料
db.student.insert([, ])
# 插入一條
db.student.insert()
查資料:
# 查詢student集合中所有資料
db.student.find({})
# 查一條 查詢name為tank的記錄
db.student.find()
2、鏈結mongodb客戶端
client = mongoclient('localhost', 27017)
爬取豌豆莢:
python打卡第八天
一,字典 字典是另一種可變容器模型,且可儲存任意型別物件。字典的每個鍵值 key value 對用冒號 分割,每個對之間用逗號 分割,整個字典包括在花括號 中 格式如下所示 d 鍵必須是唯一的,但值則不必。值可以取任何資料型別,但鍵必須是不可變的,如字串,數字或元組。dict 建立字典 print ...
Python學習第八天
字典與集合 字典是一種列表,只不過其中儲存的元素成了鍵值對,字典的每個鍵值 key value 對用冒號 分割,每個鍵值對之間用逗號 分割,整個字典包括在花括號 中 格式如下所示 d 值可以取任何資料型別,但鍵必須是不可變的,如字串,數字或元組。乙個簡單的字典例項 dict1 dict2 dict ...
學習python 第八天
物件導向 多型 多種形態 繼承 重寫 類與類之間的關係 繼承 關聯 組合,聚合 依賴 關聯 乙個類的物件作為另乙個類的屬性 依賴 乙個類的物件作為另乙個類的方法的引數 耦合程度 繼承 關聯 依賴 封裝 類屬性 物件屬性 class a name 張三 類屬性 def init self,age se...