Jsoup解析html字串

2021-10-03 18:18:10 字數 2348 閱讀 8132

現有一段html**如下

"本地資料庫連線.txt"

>本地資料庫連線 .txt<

"工作安排計畫.xls"

>工作安排計畫.xls<

"專案開發幫助文件.docx"

>專案開發幫助文件.docx<

/a>

<

/p>

>

<

/p>

需要從中取出src="/downloadimg?id=7566876320816252412",href="/telleditor/previewordownload/6405467898840828674?&hasdownload=true",href="/telleditor/previewordownload/3250930489916801852?&hasdownload=true"和href="/telleditor/previewordownload/8833048008381252472?&hasdownload=true"中的id。想起之前自己寫爬蟲用過的jsoup可以解析html,我的做法如下

string html =

"20200310

document document = jsoup.

parse

(html)

; elements imgelements = document.

select

("img[title]");

//獲取帶src屬性的img標籤

elements aelements = document.

select

("a[href]");

//獲取帶有href的a標籤

list

imgstrings =

newarraylist

(); list

astrings =

newarraylist

();for

(element element:imgelements)

for(element element:aelements)

for(string astring:astrings)

for(string imgstring:imgstrings)

結果如下

使用 jsoup 解析HTML

test public void analysishtmlbystring test public void anlysishtmlbyfile throws ioexception element ele doc.getelementbyid btn system.out.println ele....

使用 jsoup 解析HTML

test public void analysishtmlbystring test public void anlysishtmlbyfile throws ioexception element ele doc.getelementbyid btn system.out.println ele....

angular6 解析HTML字串

使用angular 顯示html文字 使用插值表示式 直接顯示html內容,則html的標籤不會被解析 雖然使用innerhtml屬性可以正常顯示html內容 將html字串以html標籤顯示出來,但是出於安全考慮,angular的淨化機制會過濾掉某些內容,來幫你防範跨站指令碼攻擊 xss 類的安全...