首先去官網
這次爬取的是某網的資料(本次爬取僅為測試,不得用於商業用途,用於商業用途與本人無關)
在瀏覽器中檢視頁面的原始碼,找到我們要爬的資料**
整個條目的網頁**如下
1.根據條目的class來定位我們要抓取的資料
elements elementsbyclass = doc.getelementsbyclass("pictxt02 clearfix");
當前的elements是包涵全部的條目的,所以需要去遍歷每個條目
2.在遍歷的迴圈中,在選取我們要提取的資料
elements h3 = list.getelementsbytag("h3");//通過h3標籤獲取到element物件
string url= h3.select("a").first().attr("href");//再通過h3物件獲取到a標籤中的頁面鏈結
string img = list.getelementsbytag("a").select("img").first().attr("src");//獲取鏈結
elements p = list.getelementsbytag("p");//獲取簡介
string text = p.text();
elements ly = list.getelementsbyclass("ly");//獲取**
string ly = ly.get(0).text();
通過以上**就能抓取當前也的資料了
Android中Jsoup的使用 網頁內容解析
jsoup的庫的主要api介紹 jsoup例項 html是一種超文字標記語言。我們平時使用瀏覽器瀏覽的web頁面幾乎都是html格式的文字。下面是乙個hello world的html頁面的 a sample demotitle head hello world body html 從上面的 我們可以...
使用JSoup選擇器語法來查詢元素
你想使用類似於css或jquery的語法來查詢和操作元素。可以使用element.select string selector 和elements.select string selector 方法實現 file input new file tmp input.html document doc ...
Jsoup使用選擇器語法來查詢元素
你想使用類似於css或jquery的語法來查詢和操作元素。可以使用element.select string selector 和elements.select string selector 方法實現 file input new file tmp input.html document doc ...