Python 獲取 html 網頁內容

2021-09-23 18:29:41 字數 1206 閱讀 4341

一篇基礎文章,不講爬蟲。單純的獲取標籤元素的值、操作網頁。

用到了 selenium 包。 這個包需要給瀏覽器安裝驅動,不同的瀏覽器需要的驅動不同。環境搭建參考:

需要注意,windows版本的驅動檔案.exe需要放在python.exe所在的目錄下,環境變數才能生效(別問我為什麼,我也不知道 (✪ω✪))

# 打**狐瀏覽器

browser=webdriver.firefox(

)browser.get(

"")# 獲取'新聞'超連結中的文字 3種方法

print

(browser.find_element_by_name(

"tj_trnews"

).text)

print

(browser.find_element_by_xpath(

"//*[@name='tj_trnews']"

).text)

print

(browser.find_element_by_css_selector(

"div#u1 > a")[

1].text)

# 在輸入框輸入'hello world'

browser.find_element_by_id(

"kw"

).send_keys(

"hello world"

)browser.find_element_by_id(

"su"

).click(

)# 清除搜尋框內容

browser.find_element_by_id(

"kw"

).clear(

)# 呼叫js**

js="alert('hello world');"

browser.execute_script(js)

# 關閉瀏覽器

sleep(1)

browser.quit(

)

Python獲取網頁Html文字

通過urllib2包,根據url獲取網頁的html文字內容並返回 coding utf 8 import requests,json,time,re,os,sys,time import urllib2 設定為utf 8模式 reload sys sys.setdefaultencoding utf...

獲取網頁html內容

獲取網頁html內容 今天寫個簡單的程式,根據指定的 url 來抓取相應的網頁內容,然後存入本地檔案。這個程式會涉及到網路請求和檔案操作等知識點,下面是實現 二 讀取資源資料 body byte body,err ioutil.readall res.body 關閉資源流 res.body.clos...

python 獲取網頁內容 python

詳細內容 python用做資料處理還是相當不錯的,如果你想要做爬蟲,python是很好的選擇,它有很多已經寫好的類包,只要呼叫,即可完成很多複雜的功能。contents page.read 獲得了整個網頁的內容也就是源 print contents url代表 contents代表 所對應的源 ur...