終於,在google上找到了jsoup,其官網(上的demo神奇的只有兩句話
documentdoc
=jsoup.
connect
("").get
();elementsnewsheadlines
=doc
.select
("#mp-itn ba");
你沒看錯,他可以直接根據你給的鏈結返回dom,並像jquery那樣按照元素型別、id、css樣式過濾你要找的dom元素,所有返回的元素都放在elements中,每個elements中的元素也可包含子元素,層級清晰。
為什麼用jsoup:
2-語法簡單,如果你用過css,抑或jquery,或者在web前端操作過dom,恭喜你,你會愛上jsoup。org.jsoup
jsoup
1.7.2
public static void main(stringargs) throwsfilenotfoundexception
}
}catch (ioexception e)
}
Jsoup簡單爬蟲實戰演練 解析URL
雖然爬取的都是一些特別簡單的資料。但是,為了避免出現什麼經濟糾紛,本人還是選擇以爬取自己的部落格為例來進行資料的爬取。由於本人也是剛開始學習jsoup,如果有什麼不應該出現的問題,歡迎各位批評指正。本人的部落格主頁 按f12鍵檢查 如何爬取網頁中的title標籤內容 爬取meta標籤中,conten...
jsoup爬蟲工具超簡單使用 記錄
簡單入門案例 document document null trycatch ioexception e if document null return 接下來獲取到了document物件,就等於獲取了頁面的所有資訊對document的操作 通過class獲取乙個元素節點 elements list...
Jsoup的使用(詳解)
乙個很強力的html解析的第三方庫 compile org.jsoup jsoup 1.9.2 jsoup官網 jsoupapi string html 你的html 段body html document doc jsoup.parse html 這個方法使我們解析任何乙個html的必定開始。js...