jsoup工具類簡介
1.jsoup:用於解析xml或是html文件 ->獲取document
2.docuemnt: public class document extends element 包含整個xml內容
3.element:獲取子element物件,屬性,文字內容
4.elements:包含若干element的arraylist
5.node
6.selector:選擇器
參考:
1.jsoup:用於解析xml或是html文件 ->獲取document
靜態parse返回document物件: parse the contents of a file as html
1.parse(file in, string charsetname)
//解析本地檔案
2.parse(url url,int timeoutmillis)
//only http & https protocols supported
2.docuemnt: public class document extends element 包含整個xml內容
獲取element/elements物件(來自父類element)
1.element getelementbyid(string id)
2.elements getelementsbytag(string tagname)
3.elements getelementsbyattribute(string key)
4.elements getelementsbyattributevalue(string key, string value)
5.elements getelementsbyattributevaluecontaining(string key,string with)
6.selector:選擇器->快捷查詢
(同上也**父類element)
6.elements select(string query)
1.document.select("person[number=s1]");
//person標籤中的屬性number值為s1
2.document.select("person[number=s1]>name");
//person標籤中的屬性number值為s1的name子標籤
3.document.select("person name[id = first]");
//person的name子標籤中的屬性id且值為first的
3.element:獲取子element物件,屬性,文字內容
獲取element物件:
1.element getelementbyid(string id)
2.elements getelementsbytag(string tagname)
3.elements getelementsbyattribute(string key)
4.elements getelementsbyattributevalue(string key, string value)
5.elements getelementsbyattributevaluecontaining(string key,string with)
獲取屬性值(來自node)
1.string attr(string attributekey)
獲取文字內容:
1.string text() //所有文字資訊
2.string html() //按含標籤的文字資訊
4.elements :public class elements extends arraylist
5.node:層次關係(父類->子類)
node -> element -> document
併發工具類簡介
countdownlatch 閉鎖,也叫執行緒遞減鎖。對執行緒進行計數,在計數歸零之前執行緒會陷入阻塞 直到計數歸零為止,才會放開阻塞。用給定的計數初始化 countdownlatch。由於呼叫了 countdown 方法,所以在當前計數到達零之前,await 方法會一直受阻塞。之後,會釋放所有等待...
java 中的併發工具類簡介
1 等待多執行緒完成的countdownlatch countdownlatch允許乙個或多個執行緒等待其他執行緒完成操作。2 同步屏障cyclicbarrier cyclicbarrier的字面意思是可迴圈使用 cyclic 的屏障 barrier 它要做的事情是,讓一組執行緒到達乙個屏障 也可以...
jsoup爬蟲工具超簡單使用 記錄
簡單入門案例 document document null trycatch ioexception e if document null return 接下來獲取到了document物件,就等於獲取了頁面的所有資訊對document的操作 通過class獲取乙個元素節點 elements list...