一篇基礎文章,不講爬蟲。單純的獲取標籤元素的值、操作網頁。
用到了 selenium 包。 這個包需要給瀏覽器安裝驅動,不同的瀏覽器需要的驅動不同。環境搭建參考:
需要注意,windows版本的驅動檔案.exe需要放在python.exe所在的目錄下,環境變數才能生效(別問我為什麼,我也不知道 (✪ω✪))
# 打**狐瀏覽器
browser=webdriver.firefox(
)browser.get(
"")# 獲取'新聞'超連結中的文字 3種方法
(browser.find_element_by_name(
"tj_trnews"
).text)
(browser.find_element_by_xpath(
"//*[@name='tj_trnews']"
).text)
(browser.find_element_by_css_selector(
"div#u1 > a")[
1].text)
# 在輸入框輸入'hello world'
browser.find_element_by_id(
"kw"
).send_keys(
"hello world"
)browser.find_element_by_id(
"su"
).click(
)# 清除搜尋框內容
browser.find_element_by_id(
"kw"
).clear(
)# 呼叫js**
js="alert('hello world');"
browser.execute_script(js)
# 關閉瀏覽器
sleep(1)
browser.quit(
)
Python獲取網頁Html文字
通過urllib2包,根據url獲取網頁的html文字內容並返回 coding utf 8 import requests,json,time,re,os,sys,time import urllib2 設定為utf 8模式 reload sys sys.setdefaultencoding utf...
獲取網頁html內容
獲取網頁html內容 今天寫個簡單的程式,根據指定的 url 來抓取相應的網頁內容,然後存入本地檔案。這個程式會涉及到網路請求和檔案操作等知識點,下面是實現 二 讀取資源資料 body byte body,err ioutil.readall res.body 關閉資源流 res.body.clos...
python 獲取網頁內容 python
詳細內容 python用做資料處理還是相當不錯的,如果你想要做爬蟲,python是很好的選擇,它有很多已經寫好的類包,只要呼叫,即可完成很多複雜的功能。contents page.read 獲得了整個網頁的內容也就是源 print contents url代表 contents代表 所對應的源 ur...