PHP 中轉換 SGML 類語言為真實中文字元

2021-07-15 13:02:10 字數 967 閱讀 7252

昨天在用 php 在做乙個資料採集專案的時候遇到了乙個特殊的問題,就是中文被特殊的字元轉化,用php採集過來還是保持原來的字元,但在瀏覽器會被編譯成正常的中文字元顯示在頁面上,但你開啟源**檢視時還是會保持原來的字元。

『ubuntu | 全球領先的用於個人電腦、平板及手機的作業系統』

上面是這個特殊的原形,經過網路的查詢,說這一串字元是 html、xml 等 sgml 類語言的轉義序列(escape sequence)。它們不是「編碼」。

&

#dddd;

&#xhhhh;

&#name;

以 html 為例,這三種轉義序列都稱作 character reference:

從 html 4 開始,ncr 以 unicode 為準,與文件編碼無關。

通過以上資料的提示,我開始查詢 php 有關 unicode 方面的資訊,所以昨天就找到這篇我收藏的《php實現unicode和utf-8編碼的互相轉換》可無奈的是依然無法解決我想直接在 php 中就將這字元直接轉換成將中文輸出的問題,於是今天上午我又換了一種思路去開始查詢,最後終於讓我找到了解決方法。

原來 php 自帶就有兩個函式來解決這個問題,這兩個函式分別是 html_entity_decode 和 mb_convert_encoding。

至於這兩個函式的用法,大家可以看 php 官方的手冊就明白,這個不多說了,下面是兩個函式解決這個問題的寫法。

$string 

='ubuntu | 全球領先的用於個人電腦、平板及手機的作業系統'

;$str1

=html_entity_decode

($string

);$str2

=mb_convert_encoding

($string

,'utf-8'

,'html-entities'

);

mysql和oracle中轉換類函式

mysql轉換類函式 1 用於將資料從一種型別轉換為另外一種型別 1 date format 將日期轉換成字串 按照指定格式轉換 select date format now y年 m月 d日 2 str to date 將日期格式的字串 轉換成指定格式的日期 日期格式解析 2 to number和...

php 中英文語言轉換類

起初想到製成xml文件形式,這樣操作也起來很容易。只是看到說xml效率不怎樣 再者就是不同的模板,可這樣也有個小問題,有些詞彙比如時間提示是不確定,與可能是minute day。也有可能複數加 s 那好吧,做成陣列,可陣列就得做成在php檔案的變數,很難做些擴充套件 我所知道所認為的是這樣 最後做成...

Go語言中轉換JSON資料簡單例子

go語言轉換json資料真是非常的簡單。以easyui的demo為例,將 demo datagrid datagrid data1.json 拷貝到 gopath src目錄 json.go 複製 如下 package main import encoding json fmt io ioutil ...