phpquery教程可在這裡檢視:
2、抓取程式
<?php3、執行效果/** created on 2015-1-29
* * to change the template for this generated file go to
* window - preferences - phpeclipse - php - code templates */
header("content-type:text/html; charset=utf-8");
function getpage( $url
)include 'phpquery/phpquery.php';
$url = '';
$page = getpage($url
);//
phpquery::newdocumenthtml($page);
phpquery::newdocumentfile($url
);$firstcate = pq('#allsort .m');
$id = 0;
foreach($firstcate
as$first
)
echo "#0#1
";$companies = pq($first)->find(".mc dl");
$parent_id = $id
;
foreach($companies
as$company
)
} }?>
這樣可以抓取京東商品分類的資訊了。可以加上資料庫,將資料儲存在資料庫中,這樣可以更利於資料的儲存和操作。雖然這裡只是抓取京東商品的分類,如果延伸一下的話還可以抓取商品**,好評差評等資訊。這裡就不一一細說了,具體問題具體解決,完全看需求。如果有需要的話還可以做成萬能的,輸入標籤的xpath,然後得到具體的值;這純屬yy,有興趣的可以網上找找資料,實現的方式應該也不少。
php phpquery簡易爬蟲抓取京東商品分類
phpquery教程可在這裡檢視 2 抓取程式 created on 2015 1 29 to change the template for this generated file go to window preferences phpeclipse php code templates hea...
php phpquery簡易爬蟲抓取京東商品分類
phpquery教程可在這裡檢視 2 抓取程式 created on 2015 1 29 to change the template for this generated file go to window preferences phpeclipse php code templates hea...
簡易文字爬蟲
正規表示式 1 使用re.findall 所有符合條件的 一般查詢列表結果就是所獲得值 re.search 一條符合記錄的 通過match物件內的group編號或命名,獲得對應的值 title re.research html,re.s group 1 能包括換行符 使用sub 替換 實現換頁功能 ...