Jsoup抓取資料

2021-07-24 12:37:31 字數 1688 閱讀 9193

首先我們來看來自」的乙個html片段,了解其結構。

class="detail"

style="display: block;">

class="add jrsj_plus"

bookid="609737">

em>

class="mark63"

href=""

target="_blank">

src=""

alt="不死龍帝"

style="width: 63px; height: 84px;">

span>

a>

style=""

href=""

title="奇幻玄幻: 不死龍帝"

target="_blank">不死龍帝a>

h3>

href=""

title="從小不愛吃香菜"

target="_blank">從小不愛…a>

p>

型別:href=""

title="奇幻玄幻"

target="_blank">奇幻玄幻a>

p>

class="tr">

href=""

target="_blank">【閱讀】a>

p>

class="cl0">

div>

div>乙個尖括號中表示乙個element元素,可以先得到乙個大片段的元素,再詳細解析得到每乙個要得到的內容,也可以縮小範圍得到要得到的內容。

例如:elements elements = document.select("div.detail");

這裡得到的是乙個div裡面的element集合。

例如:

element element1 = document1.getelementbyid("chaptercontent").text();

titlestr = document1.body().attr("chaptername");

這裡直接得到」id」為」chaptercontent」的元素的內容。

.attr表示得到屬性裡的內同。

詳細的方法還有很多,可以參考jsoup中文api文件。

}效果圖:

注意點:

1.抓取網路要開啟執行緒

2.得到內容後要通過handle發訊息給主線程改變ui內容。

Jsoup元件抓取HTML標籤

jsoup可以解析乙個html字串,可以解析乙個url,也可以解析乙個html文字 1 解析乙個字串 public static void parsehtmltext 說明 parse string html,string baseuri 這方法能夠將輸入的html解析為乙個新的文件 documen...

Java中用Jsoup抓取網頁上的資料

document doc 建立document 物件,使我們可以對 html 頁面中的所有元素進行訪問 doc jsoup.connect http x get 括號中填入你想要訪問的網頁鏈結 element doc.getelementbyid element 物件,主要是依靠 dom 元素樹結構...

jsoup網頁內容抓取分析 2

下面寫些我的使用記錄,希望大家如果能從我的方法中得到啟發,鑑於本人從事開發工作不久,內容可能寫的不是很好。jsoup資料獲取有兩大方法 1.通過分析dom模型的網頁標籤和元素,2.select元素選擇器,類似jquery方式 功能很強大,還支援正規表示式 網頁tag標籤有body,div,table...