困於心衡於慮而後作
今天的學習目標是,實現flask與爬蟲聯調,自己寫網頁伺服器,然後寫爬蟲進行爬取內容
首先是先寫flask服務
1.建立html檔案
首先在當前資料夾內建立helloword.html
lang
="en"
>
>
charset
="utf-8"
>
>
hello wordtitle
>
head
>
>
>
helloword!!!!h1
>
body
>
html
>
2.建立flask服務
當前資料夾內建立flaskserver.py,執行後開啟flask服務
from flask import flask
# 宣告乙個flask例項
'/')
defindex()
:try
: f =
open
('helloword.html'
,'rb'
) data = f.read(
) f.close(
)return data
except exception as err:
return
str(err)
if __name__ ==
'__main__'
:true
)
這個時候看看執行結果,開啟瀏覽器及可以看見自己寫的html檔案
3.爬取helloword.html網頁
使用requests爬取自己寫的網頁
import requests
try:
url =
''html = requests.get(url)
html.raise_for_status(
) print
(html.text)
except
:print
('爬取錯誤!!!'
)print
(html.headers)
執行之後就可以看到自己的網頁原始碼 python基礎flask 爬蟲上傳檔案
不以物喜不以己悲 人生不能放棄 今天的學習目標是 爬蟲上傳檔案到flask伺服器 1.客戶端程式 import urllib import urllib.request import os url filename fe.png try fobj open filename,rb 讀出資料 data...
flask 呼叫 python爬蟲 記錄
過程 爬蟲問題 後來呼叫 模擬登陸,selenium 火狐瀏覽器,虛擬機器環境下,模擬登陸是 控制滑鼠點選網頁指定位置,進入到輸入框中,控制鍵盤輸入賬號密碼,出現問題是 彈出的瀏覽器視窗中,自動輸入站好密碼,英文本元可以正常輸入,中文字元無法輸入,嘗試 手動接管後還是 無法輸入中文,後來 有換 系統...
python爬蟲基礎
一 什麼是爬蟲 通常爬蟲是從某個 的某個頁面開始,爬取這個頁面的內容,找到網頁中的其他鏈結位址,然後從這個位址爬到下乙個頁面,這樣一直不停的爬下去,進去批量的抓取資訊。那麼,我們可以看出網路爬蟲就是乙個不停爬取網頁抓取資訊的程式。二 爬蟲的基本流程 1,發起請求 向目標站點傳送乙個requests請...