利用jsoup可以實現對網頁資訊進行有效解析和提取,例如有網頁內容如下:
hello, jsoup!
jsoup的官方**
利用jsoup提取標籤的內容,**如下:
document doc = null;
trycatch(ioexception ioe)
//提取標籤的內容
string strtitle = doc.select("title").text();
//提取id屬性值為gtop的標籤的內容
string strtext = doc.select("div[id=gtop]").text();
//提取網頁中的鏈結
string strurl = doc.select("a").first().absurl("href");
...jsoup提供了強大的查詢選擇器selector類幫助使用者用盡可能簡短的查詢獲取相關的資訊。但是,我在使用時發現了乙個小問題,就是對class屬性值含有空格的標籤進行提取時,利用如下查詢模式是提取不到結果的。以上面的例子進行說明:
//提取class屬性值為footer-mid tol的標籤的內容
string strtext = doc.select("div.footer-mid tol").text();
查詢結果為空字串,但是利用下述查詢模式就會得到結果
//提取class屬性值為footer-mid tol的標籤的內容
//正確格式
string strtext = doc.select("div[class=footer-mid tol]").text();
但是,如果class屬性值不含有空格,則如下兩種方式都可以得到正確的結果
//提取class屬性值為w的標籤的內容
string strtext1 = doc.select("div.w").text();
string strtext2 = doc.select("div[class=w]").text();
所以,在寫程式時,還是盡可能用[attr=val]
模式進行查詢。
乙個關於選擇的小問題
以前看過這樣乙個問題 乙個人參加有獎答題,主持人給出了a b c三個選項。這個不知道問題的答案,就隨便選了乙個選項。然後主持人排除了剩下兩個答案中的乙個,告訴這個人有一次改變自己選項的機會。請問 這時候這個人該不該改變自己的選項?剛看到這個問題,我的第一反映是完全沒必要,因為既然排除了乙個錯誤選項,...
關於指標的乙個小問題
任務 c primer 4th 習題5.18 編寫程式定義乙個vector物件,其每個元素都是指向string型別的指標,讀取該vector物件,輸出每個string的內容及其相應的長度。自己的方法 string s string sarr 10 vector內的每個元素都是指向string型別的指...
乙個小問題
error c2679 binary no operator defined which takes a right hand operand of type class smanip int or there is no acceptable conversion 除錯了好久,就是找不出問題在哪。...