php 抓取頁面亂碼

2021-08-03 22:34:07 字數 521 閱讀 3541

在抓取頁面的時候出現類似�������這樣亂碼解決方法如下

1、轉換編碼

st

r=mb

conv

erte

ncod

ing(

str, 「utf-8」, 「gbk」);

2、資料經過gzip壓縮

curl獲取資料的時候設定新增下面的選項:

curl_setopt($ch, curlopt_encoding, 'gzip');

使用file_get_contents函式需要安裝zlib庫

$data = file_get_contents("compress.zlib://".$url);

3、獲取資料後顯示亂碼

在頂部增加下面的**

header("content-type: text/html; charset=utf-8");

PHP抓取頁面的幾種方式

php抓取頁面的幾種方式 我們在開發網路程式時,往往需要抓取非本地檔案,一般情況下都是利用php模擬瀏覽器的訪問,通過http請求訪問url位址,然後得到html源 或者xml資料,得到資料我們不能直接輸出,往往需要對內容進行提取,然後再進行格式化,以更加友好的方式顯現出來。下面簡單說一下php抓取...

PHP頁面中文亂碼分析

php頁面中文亂碼出現的原因有幾種,一種是頁面編碼不統計一,二是資料庫未設定編碼,三是apache編碼有問題,下面我來給大家介紹兩種解決辦法,總體來講就是頁面編碼不統一了。出現亂碼大部分是由於編碼方式的不一致導致的,其中主要有四個地方不一致就可能存在這個可能 1 頁面檔案的編碼方式 html,php...

CURL抓取頁面

curl是利用url語法在命令列方式下工作的開源檔案傳輸工具,他能夠從網際網路上獲得各種各樣的網路資源。簡單來說,curl就是抓取頁面的公升級版。1.初始化,建立乙個新curl資源 ch curl init 2.設定url和相應的選項 curl setopt ch,curlopt url,curl ...