首先我們來看來自」的乙個html片段,了解其結構。
class="detail"
style="display: block;">
class="add jrsj_plus"
bookid="609737">
em>
class="mark63"
href=""
target="_blank">
src=""
alt="不死龍帝"
style="width: 63px; height: 84px;">
span>
a>
style=""
href=""
title="奇幻玄幻: 不死龍帝"
target="_blank">不死龍帝a>
h3>
href=""
title="從小不愛吃香菜"
target="_blank">從小不愛…a>
p>
型別:href=""
title="奇幻玄幻"
target="_blank">奇幻玄幻a>
p>
class="tr">
href=""
target="_blank">【閱讀】a>
p>
class="cl0">
div>
div>乙個尖括號中表示乙個element元素,可以先得到乙個大片段的元素,再詳細解析得到每乙個要得到的內容,也可以縮小範圍得到要得到的內容。
例如:elements elements = document.select("div.detail");
這裡得到的是乙個div裡面的element集合。
例如:
element element1 = document1.getelementbyid("chaptercontent").text();
titlestr = document1.body().attr("chaptername");
這裡直接得到」id」為」chaptercontent」的元素的內容。
.attr表示得到屬性裡的內同。
詳細的方法還有很多,可以參考jsoup中文api文件。
}效果圖:
注意點:
1.抓取網路要開啟執行緒
2.得到內容後要通過handle發訊息給主線程改變ui內容。
Jsoup元件抓取HTML標籤
jsoup可以解析乙個html字串,可以解析乙個url,也可以解析乙個html文字 1 解析乙個字串 public static void parsehtmltext 說明 parse string html,string baseuri 這方法能夠將輸入的html解析為乙個新的文件 documen...
Java中用Jsoup抓取網頁上的資料
document doc 建立document 物件,使我們可以對 html 頁面中的所有元素進行訪問 doc jsoup.connect http x get 括號中填入你想要訪問的網頁鏈結 element doc.getelementbyid element 物件,主要是依靠 dom 元素樹結構...
jsoup網頁內容抓取分析 2
下面寫些我的使用記錄,希望大家如果能從我的方法中得到啟發,鑑於本人從事開發工作不久,內容可能寫的不是很好。jsoup資料獲取有兩大方法 1.通過分析dom模型的網頁標籤和元素,2.select元素選擇器,類似jquery方式 功能很強大,還支援正規表示式 網頁tag標籤有body,div,table...