其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。
利用firebug的網路工具
如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js**。
curl_setopt($ch, curlopt_encoding ,'gzip'); //加入gzip解析
//設定連線結束後儲存cookie資訊的文uqtgi件
curl_setopt($ch,curlopt_cookiejar,$cookie_file);
$content=curl_exec($ch);
curl_close($ch);
$ch3 = curl_init();
$url3 = "";
$curlpost = "callcount=1&page=/xww/type/1000020118.html&httpsessionid=12a9b726e6a2d4d3b09de7952b2f282c&scriptsessionid=295315b4b4141b09da888d3a3adb8faa658&c0-scriptname=portalajax&c0-methodname=getnewsxml&c0-id=0&c0-param0=string:10000201&c0-param1=st程式設計客棧ring:1000020118&c0-param2=string:news_&c0-param3=number:5969&c0-param4=number:1&c0-param5=null:null&c0-param6=null:null&batchid=0";
curl_setopt($ch3,curlopt_url,$url3);
curl_setopt($ch3,curlopt_post,1);
curl_setopt($ch3,curlopt_postfields,$curlpost);
//設定連線結束後儲存cookie資訊的檔案
curl_setopt($ch3,curlopt_cookiefile,$cookie_file);
$content1=curl_exec($ch3);
curl_close($ch3);
本文標題: php curl 抓取ajax非同步內容示例
本文位址: /wangluo/php/113394.html
PHP curl 抓取AJAX非同步內容
其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js 加入gzip解析 設定連線結束後儲存c...
php curl 多執行緒抓取
curl 多執行緒抓取 curl 多執行緒 param array array 並行 param int timeout 超時時間 防止死迴圈耗死cpu 這段是根據網上的寫法 do while mrc curlm call multi perform 當正在接受資料時 while active an...
phpCURL抓取網頁內容
參考 1 建立乙個新curl資源 ch curl init 設定url和相應的選項 curl setopt ch,curlopt url,curl setopt ch,curlopt header,false 抓取url並把它傳遞給瀏覽器 data curl exec ch echo data 關閉...