HTML實體與網頁編碼

2021-06-22 12:51:44 字數 1112 閱讀 4952

漢字都轉化為了html實體(十進位制表示的unicode編碼),這樣做的好處就是不管網頁的編碼是什麼,都可以正常的顯示漢字,而不會出現亂碼,當然也適用於其他字符集。

在php中我們可以用mbstring的mb_convert_encoding函式實現這個正向及反向的轉化。

如:mb_convert_encoding ("你好", "html-entities", "gb2312");    //輸出:你好

mb_convert_encoding ("你好", "gb2312", "html-entities");    //輸出:你好 

如果需要對整個頁面轉化,則只需要在php檔案的頭部加上這三行**:

mb_internal_encoding("gb2312");  // 這裡的gb2312是你**原來的編碼

asp版可以用下面這個函式來實現這個轉化:

function htmlentities(str)

for i = 1 to len(str)

char = mid(str, i, 1)

if ascw(char) > 0 then

htmlentities = htmlentities & "&#" & ascw(char) & ";"

else

htmlentities = htmlentities & "&#" & (65536 + ascw(char)) & ";"

end if

next

end function 

js 版

function htmlentities(str)

//  也可以用一句正規表示式解決

// r = str.replace(/[\d\d]/g, function($0) );

return r;

}asp.net (c#) 版

private string gethtmlentities(string str)

return r;

}

HTML實體與網頁編碼 漢字轉化為了html實體

漢字都轉化為了html實體 十進位制表示的unicode編碼 這樣做的好處就是不管網頁的編碼是什麼,都可以正常的顯示漢字,而不會出現亂碼,當然也適用於其他字符集。在php中我們可以用mbstring的mb convert encoding函式實現這個正向及反向的轉化。如 mb convert enc...

html實體符號編碼解析

在瀏覽器中有很多字元,都是屬於保留字元,例如 對sgml,html,xml來說是有特殊意義的,如果某些unicode字元在文件的當前編碼方式 如iso 8859 1 中不能直接表示,那麼就可以通過字元值引用,這裡也稱之為實體編號或者字元實體引用,這裡也稱之為實體符號兩種轉義序列來表示這些不能直接編碼...

網頁中常用HTML字元實體

摘要 一些字元在 html 中擁有特殊的含義,比如小於號 用於定義 html 標籤的開始。如果我們希望瀏覽器正確地顯示這些字元,我們必須在 html 原始碼中插入字元實體。字元實體有三部分 乙個和號 乙個實體名稱,或者 一些字元在 html 中擁有特殊的含義,比如小於號 用於定義 html 標籤的開...