#例項
from selenium import webdriver
import time
from selenium.webdriver.chrome.options import options
# selenium的headless模式
chrome_options = options()
chrome_options.add_argument("--headless")
chrome_options.add_argument("window-size=1980,1080")
driver = webdriver.chrome(chrome_options=chrome_options)
driver.get('url位址')
time.sleep(3)
ul_eles = driver.find_elements_by_xpath('//div[@class="wlist"][2]/ul/li[@style="text-align:center;"]/ul')
各種物件中的成員方法 (單數)
1.id定位:find_element_by_id(self, id_)
2.name定位:find_element_by_name(self, name)
3.class定位:find_element_by_class_name(self, name)
4.tag定位:find_element_by_tag_name(self, name)
5.link定位:find_element_by_link_text(self, link_text)
6.partial_link定位find_element_by_partial_link_text(self, link_text)
7.xpath定位:find_element_by_xpath(self, xpath)
8.css定位:find_element_by_css_selector(self, css_selector)
各種物件中的成員方法 (複數) 注意點:複數是elements 單數是element
9.id複數定位find_elements_by_id(self, id_)
10.name複數定位find_elements_by_name(self, name)
11.class複數定位find_elements_by_class_name(self, name)
12.tag複數定位find_elements_by_tag_name(self, name)
13.link複數定位find_elements_by_link_text(self, text)
14.partial_link複數定位find_elements_by_partial_link_text(self, link_text)
15.xpath複數定位find_elements_by_xpath(self, xpath)
16.css複數定位find_elements_by_css_selector(self, css_selector
複數都是返回的列表結構
所以可以使用res[0].text(使用下標獲取指定元素的文字內容)
sikuli在selenium的應用
1.sikuli簡介 sikuli 指令碼自動化技術,它通過影象識別技術來控制不能通過xpath css來識別的元素。2.我的硬體環境 pc 64位 jdk 1.8.0 25 sikuli 1.1.1 經驗證,該環境也能支援sikuli。pom.xml細節 org.sikuli sikuli cor...
在selenium中使用JQuery
selenium的xpath確實功能不夠強大啊,還是喜歡用jquery.今天嘗試了一下,其實是可以在selenium中用jquery來分析dom的.執行以下步驟 1.把jquery的js檔案新增到selenium server.jar的 core scripts目錄下.2.修改selenium se...
Python 爬蟲利器 Selenium
前面幾節,我們學習了用 requests 構造頁面請求來爬取靜態網頁中的資訊以及通過 requests 構造 ajax 請求直接獲取返回的 json 資訊。還記得前幾節,我們在構造請求時會給請求加上瀏覽器 headers,目的就是為了讓我們的請求模擬瀏覽器的行為,防止被 的反爬蟲策略限制。今天要介紹...