php 抓取div內容

2021-06-16 05:00:04 字數 2704 閱讀 1618

1. 取得指定網頁內的所有圖片:測試

開新視窗

複製程式碼

列印?

<?php   

//取得指定位址的內容,並儲存至text

$text=file_get_contents(''

);    

//取得所有img標籤,並儲存至二維陣列match

preg_match_all('#]*>#i'

, $text, $match);   

//印出match

print_r($match);   

?>  

<?php

//取得指定位址的內容,並儲存至text

$text=file_get_contents('');

//取得所有img標籤,並儲存至二維陣列match

preg_match_all('#]*>#i', $text, $match);

//印出match

print_r($match);

?>

2. 取得指定網頁內的第一張圖片:測試

開新視窗

複製程式碼

列印?

<?php   

//取得指定位址的內容,並儲存至text

$text=file_get_contents(''

);   

//取得第乙個img標籤,並儲存至陣列match(regex語法與上述同義)

preg_match('/]*>/ui'

, $text, $match);   

//印出match

print_r($match);   

?>  

<?php

//取得指定位址的內容,並儲存至text

$text=file_get_contents('');

//取得第乙個img標籤,並儲存至陣列match(regex語法與上述同義)

preg_match('/]*>/ui', $text, $match);

//印出match

print_r($match);

?>

3. 取得指定網頁內的特定div區塊(藉由id判斷):測試

開新視窗

複製程式碼

列印?

<?php   

//取得指定位址的內容,並儲存至text

$text=file_get_contents('2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/'

);    

//去除換行及空白字元(序列化內容才需使用)

//$text=str_replace(array("/r","/n","/t","/s"), '', $text);   

//取出div標籤且id為postcontent的內容,並儲存至陣列match

preg_match('/]*id="postcontent"[^>]*>(.*?) /si'

,$text,$match);   

//印出match[0]

print($match[0]);   

?>  

<?php

//取得指定位址的內容,並儲存至text

$text=file_get_contents('2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/');

//去除換行及空白字元(序列化內容才需使用)

//$text=str_replace(array("/r","/n","/t","/s"), '', $text);

//取出div標籤且id為postcontent的內容,並儲存至陣列match

preg_match('/]*id="postcontent"[^>]*>(.*?) /si',$text,$match);

//印出match[0]

print($match[0]);

?>

4. 上述2及3的結合:測試

開新視窗

複製程式碼

列印?

<?php   

//取得指定位址的內容,並儲存至text

$text=file_get_contents('2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/'

);       

//取出div標籤且id為postcontent的內容,並儲存至陣列match

preg_match('/]*id="postcontent"[^>]*>(.*?) /si'

,$text,$match);      

//取得第乙個img標籤,並儲存至陣列match2

preg_match('/]*>/ui'

, $match[0], $match2);    

//印出match2[0]

print_r($match2[0]);   

?>

php 抓取https內容

在php中獲取網頁資料使用curl和file get contents,但是在抓取https內容時抓取不到內容,解決方法如下 curl ch curl init curl setopt ch,curlopt url,url curl setopt ch,curlopt header,0 重點部分 c...

PHP 網頁內容抓取 抓取網頁內容的兩種常用方法

說到網頁內容的抓取,最常用的兩種方式 1.利用file get contents 函式,簡簡單單 2.curl抓取工具。curl是乙個非常強大的開源庫,支援很多協議,包括http ftp telnet等,我們使用它來傳送http請求。它給我 們帶來的好處是可以通過靈活的選項設定不同的http協議引數...

用php抓取網頁內容方法總結

用php抓取頁面的內容在實際的開發當中是非常有用的,如作乙個簡單的內容採集器,提取網頁中的部分內容等等,抓取到的內容在通過正規表示式做一下過濾就得到了你想要的內容,至於如何用正規表示式過濾,在這裡就不做介紹了,有興趣的同學可以參考本站的 正規表示式 板塊 以下就是幾種常用的用php抓取網頁中的內容的...