漢字都轉化為了html實體(十進位制表示的unicode編碼),這樣做的好處就是不管網頁的編碼是什麼,都可以正常的顯示漢字,而不會出現亂碼,當然也適用於其他字符集。
在php中我們可以用mbstring的mb_convert_encoding函式實現這個正向及反向的轉化。
如:mb_convert_encoding ("你好", "html-entities", "gb2312"); //輸出:你好
mb_convert_encoding ("你好", "gb2312", "html-entities"); //輸出:你好
如果需要對整個頁面轉化,則只需要在php檔案的頭部加上這三行**:
mb_internal_encoding("gb2312"); // 這裡的gb2312是你**原來的編碼
asp版可以用下面這個函式來實現這個轉化:
function htmlentities(str)
for i = 1 to len(str)
char = mid(str, i, 1)
if ascw(char) > 0 then
htmlentities = htmlentities & "" & ascw(char) & ";"
else
htmlentities = htmlentities & "" & (65536 + ascw(char)) & ";"
end if
next
end function
js 版
function htmlentities(str)
// 也可以用一句正規表示式解決
// r = str.replace(/[\d\d]/g, function($0) );
return r;
}asp.net (c#) 版
private string gethtmlentities(string str)
return r;
}
HTML實體與網頁編碼 漢字轉化為了html實體
漢字都轉化為了html實體 十進位制表示的unicode編碼 這樣做的好處就是不管網頁的編碼是什麼,都可以正常的顯示漢字,而不會出現亂碼,當然也適用於其他字符集。在php中我們可以用mbstring的mb convert encoding函式實現這個正向及反向的轉化。如 mb convert enc...
html實體符號編碼解析
在瀏覽器中有很多字元,都是屬於保留字元,例如 對sgml,html,xml來說是有特殊意義的,如果某些unicode字元在文件的當前編碼方式 如iso 8859 1 中不能直接表示,那麼就可以通過字元值引用,這裡也稱之為實體編號或者字元實體引用,這裡也稱之為實體符號兩種轉義序列來表示這些不能直接編碼...
網頁中常用HTML字元實體
摘要 一些字元在 html 中擁有特殊的含義,比如小於號 用於定義 html 標籤的開始。如果我們希望瀏覽器正確地顯示這些字元,我們必須在 html 原始碼中插入字元實體。字元實體有三部分 乙個和號 乙個實體名稱,或者 一些字元在 html 中擁有特殊的含義,比如小於號 用於定義 html 標籤的開...