假設我們所有的url在excel種我們可以用loadwork 這個庫 遍歷所有的url 放入 列表
再通過request 或者 httpx 來判斷 這個**status_code 進而放入mongo種
#得到物件
wb = load_workbook('
d:\kyls_working\scrapycurrencycrawl\scrapycurrencycrawl\excelwebsite\總表.xlsx')
#得到sheet頁的物件
sheet = wb['
可以訪問']
#url列表
url_list =
#迴圈兩列所有物件並生成 名
#得到乙個mongo客戶端物件
client = mongoclient("
mongodb://localhost:27017/")
#先執行刪除
client.drop_database("
urlstatus")
#再建立資料庫
db =client.urlstatus
#建立集合
coll =db.status
#遍歷第二行所有資料 並生成url 的值
for col in sheet.iter_cols(min_col=7, max_col=7, min_row=2):
for cell in
col:
url =cell.value
#將遍歷的物件放入列表中
#遍歷url 是否能夠成功訪問
#如果能成功訪問
if resp.status_code == 200:
print("
success_url
", url)
rs = coll.insert_one()
#**為404的
elif resp.status_code == 404:
print("
404"
, url)
rs = coll.insert_one()
#為其他狀態的**
else
:
print('
other
', url)
rs = coll.insert_one()
#超時**
except
timeouterror as e:
(e) rs = coll.insert_one()
**如上
也可以自行改正 。
TCP連線狀態 如何判斷乙個TCP連線是否可用
在使用乙個長連線的tcp時,如果tcp伺服器端接收到tcp的客戶端連線過來後,接著伺服器端的tcp節點需要對這個客戶端進行資料收發,收發時需要判斷這個socket是否可用用,判斷方法有多種 1.linux的5種方法,本人在使用modbus伺服器端判斷已經連線的裝置或是gprs伺服器對已經連線的gpr...
TCP連線狀態 如何判斷乙個TCP連線是否可用
在使用乙個長連線的tcp時,如果tcp伺服器端接收到tcp的客戶端連線過來後,接著伺服器端的tcp節點需要對這個客戶端進行資料收發,收發時需要判斷這個socket是否可用用,判斷方法有多種 1.linux的5種方法,本人在使用modbus伺服器端判斷已經連線的裝置或是gprs伺服器對已經連線的gpr...
判斷游標是否存在的同時檢測游標狀態
以下操作為判斷游標是否存在的同時檢測游標狀態。select case when cursor status global dd 1 then 游標的結果集至少有一行 when cursor status global dd 0 then 游標的結果集為空 when cursor status glo...