參考**1:<?php
//建立乙個新curl資源
$ch =curl_init();
//設定url和相應的選項
curl_setopt($ch, curlopt_url, "");
curl_setopt(
$ch, curlopt_header, false
);//
抓取url並把它傳遞給瀏覽器
$data = curl_exec($ch
);echo
$data;//
關閉curl資源,並且釋放系統資源
curl_close($ch
);?>
$szurl = "";
$useragent = 'mozilla/4.0 (compatible; msie 7.0; windows nt 6.0; slcc1; .net clr 2.0.50727; .net clr 3.0.04506; .net clr 3.5.21022; .net clr 1.0.3705; .net clr 1.1.4322)';
$curl =curl_init();
curl_setopt(
$curl, curlopt_url, $szurl
);curl_setopt(
$curl, curlopt_header, 0); //
0表示不輸出header,1表示輸出
curl_setopt($curl, curlopt_returntransfer, 1);
curl_setopt(
$curl, curlopt_ssl_verifypeer, false
);curl_setopt(
$curl, curlopt_ssl_verifyhost, false
);curl_setopt(
$curl, curlopt_encoding, '');
curl_setopt(
$curl, curlopt_useragent, $useragent
);curl_setopt(
$curl, curlopt_followlocation, 1);
$data = curl_exec($curl
); echo
$data;//
echo curl_errno($curl); //返回0時表示程式執行成功 如何從curl_errno返回值獲取錯誤資訊
exit
();?>
PHP curl 抓取AJAX非同步內容
其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js 加入gzip解析 設定連線結束後儲存c...
網頁內容抓取
之前採用xpath和正規表示式對網頁內容進行抓取,發現在有的地方不如人意,就採用了htmlparser對頁面進行解析,抓取需要的東西。htmlparser有點不好的地方在於不能對starttag和endtag進行匹配。採用了兩種方法進行抓取。第一種,抓取成對的tag之間的內容,採用了queue.qu...
PHP curl 抓取AJAX非同步內容示例
其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。利用firebug的網路工具 如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js curl...