1. 想對網頁上的元素進行操作,首先需要定位到元素。
# coding = gbkfrom selenium import webdriver
chrome_driver_path = "c:\python27\selenium\webdriver\chromedriver\chromedriver"
global browser
browser = webdriver.chrome(chrome_driver_path)
url_int = ""
browser.get(url_int)
通過id定位:
browser.find_element_by_id("kw")
通過name定位:
browser.find_element_by_name("wd")
通過標籤名tag_name定位:
browser.find_element_by_tag_name("input")
通過class_name定位:
browser.find_element_by_class_name("bg_s_btn_wr")
通過css定位:
以id定位:
browser.find_element_by_css_selector("a[id=\"kw\"]")
以name定位:
browser.find_element_by_css_selector("a[name=\"wd\"]")
通過xpath定位:(xpath是一種在xml文件中定位元素的語言)
attribute屬性定位(定位input標籤下,id=kw的元素):
browser.find_element_by_xpath("//input[@id='kw']")
browser.find_element_by_xpath("//div[@id='fm']/form/span/input")
id為check的tr,定位它的第2個td:
browser.find_element_by_xpath("tr[@id='check']/td[2]")
position位置定位(第7個tr裡面的第2個td):
browser.find_element_by_xpath("//tr[7]/td[2]")
browser.find_element_by_xpath("//a[contains(text(),'網頁')]")
browser.find_element_by_xpath("//a[@href='']")
browser.find_element_by_link_text("貼吧")browser.find_element_by_partial_link_text("貼")
通過class_name定位:
browser.find_element_by_class_name("bg_s_btn_wr")
利用Python抓取和解析網頁 上
對搜尋引擎 檔案索引 文件轉換 資料檢索 站點備份或遷移等應用程式來說,經常用到對網頁 即html檔案 的解析處理。事實上,通過python語言提供的各種模組,我們無需借助web伺服器 或 者web瀏覽器就能夠解析和處理html文件。本文將詳細介紹如何利用python抓取和解析網頁。首先,我們介紹乙...
python網頁資訊 利用python處理網頁資訊
在前幾周的grep sed awk實戰中提到,和coresite any2 california接入商建立網路bgp鄰居關係。從peeringdb上找到了所有接入商的資訊,但是轉移資訊到本地不是很方便,需要進行多次文字調整,耗時較長。作為萌新,立馬就想到近期學習的grep sed awk工具。於是就...
網頁中的定位
1.1.1 網頁中的定位型別 a 靜態定位 static 是預設定位 b 相對定位 relative c 絕對定位 absolute d 固定定位 fixed 瀏覽器對該定位存在相容性問題 e 參照物 1.1.2 相對定位 position relative top 20px 參照頂部發生位置偏移2...