class
="bde_image"
src=""
width
="560"
height
="314"
pic_type
="0"
>
public
class
task
implements
runnable
@override
public
void
run(
) image.
write
(buf,
0, len)
;//儲存到本地
} image.
close()
; system.out.
println
("已爬到"
+s2+
"張圖");
thread thread =thread.
currentthread()
; thread.
stop()
;}catch
(ioexception e)
}}
public
class
copypicture
// system.out.println(s);
file file=
newfile(""
);file.
mkdir()
;int current=0;
while
((current=s.
indexof
("-1)}
service.
shutdown();}}
上邊例子中,在查詢元素時,擷取了兩次字串,第一次使用indexof()找到img標籤,並將標籤擷取下來,第二次找到img標籤中的http位址。最後將位址交給執行緒去處理。
其實還可以採用正規表示式來匹配img標籤中的http位址
static
final pattern pattern = pattern.
compile
("while
(matcher.
find()
)
JAVA實現簡單網路爬蟲
這是我第一次寫部落格,所以寫的不算好,看到的人請見諒。gethtml 類,首先是url url1 new url url 模擬在網頁輸入 接著 urlconnection uc url1.openconnection 模擬敲回車鍵開啟該 頁面,後面的看注釋應該能看懂了。bf.readline 是依次...
JAVA網路爬蟲的實現
記得在剛找工作時,隔壁的一位同學在面試時豪言壯語曾實現過網路爬蟲,當時的景仰之情猶如滔滔江水連綿不絕。後來,在做搜尋時,需要大量的測試,因此萌生了從amazon中爬取圖書封面的想法,從網上也吸取了一些前人的經驗,實現了乙個簡單但足夠用的爬蟲系統。img 傳統爬蟲從乙個或若干初始網頁的url開始,獲得...
網路爬蟲的實現
網路爬蟲常常被人所忽略,特別是和搜尋引擎的光環相比,它似乎有些暗淡無光。我很少看見有詳細介紹爬蟲實現的文章或者文件。然而,爬蟲其實是非常重要的乙個系統,特別是在今天這個資料為王的時代。如果你是乙個剛剛開始的公司或者專案,沒有任何原始的資料積累,那麼通過爬蟲去internet上找到那些有價值的資料再進...