html實體符號編碼解析

2021-06-23 02:18:31 字數 1247 閱讀 6932

在瀏覽器中有很多字元,都是屬於保留字元,例如(<),對sgml,html,xml來說是有特殊意義的,如果某些unicode字元在文件的當前編碼方式(如iso-8859-1)中不能直接表示,那麼就可以通過字元值引用,這裡也稱之為實體編號或者字元實體引用,這裡也稱之為實體符號兩種轉義序列來表示這些不能直接編碼的字元。

實體編號的組成

和號(&)

井號(#)

編號(數字)

封號(;)

實體符號的組成

和號(&)

字元(字母)

封號(;)

注意點

實體名稱(entity)是區分大小寫的

備註

同乙個符號,可以用「實體名稱」和「實體編號」兩種方式引用,「實體名稱」的優勢在於便於記憶,但不能保證所有的瀏覽器都能順利識別它,而「實體編號」則沒有這種擔憂,但它實在不方便記憶。

html 4 dtd標準,定義了252個命名實體。html 4規範要求使用標準dtd,並且不允許使用者定期其它的命名實體.

在xhtml dtd中,明確宣告了253個字元實體(包括5個xml 1.0的預定義實體). 除了』實體這個例外,其它252個字元實體與html中的252個字元實體引用一致. 每個xhtml檔案例項還可以定義任意數目的字元實體。但是xhtml字元實體的可用性受到該檔案的處理方式的影響:

如果該檔案由html處理器來處理, 那麼只有252個 html字元實體可用。』或使用者定義的實體引用可能不被支援,產生不可**的效果.

如果該檔案由xml分析器來處理,只有5個xml預定義的字元實體能安全使用, 雖然定義在內部dtd子集中的其它實體也許可用。

如果xml分析器能讀外部實體,那麼除了5個xml預定義的字元實體能安全使用,只要xml分析器能讀取xhtml dtd,其它248個html字元實體也可以使用。宣告在內部dtd子集中的實體也可以使用.

舉例

一般來說,在編輯html文件時,瀏覽器會自動刪除空格。不管你按空格鍵,加入多少空格,一部分瀏覽器處理文件時,都看成乙個空格。比如你在兩個字元之間加上了10個空格,html會截去9個空格,只保留乙個。為了在網頁中,使用空格這個特殊字元,我們便可以使用實體字元或者是實體編碼來轉義成空格

在html文件中表示為: 或者是 

由於』不能在html處理器中一致的安全使用,實際上僅有」, &, <, and >4個字元實體可以在所有處理環境下通用。所以,盡量使用實體編號來轉義字元避免部分字元無法轉義。

html符號實體

html符號實體 在網頁上顯示一些特殊的符號,我們需要使用html的符號實體,有些人把它稱為字元實體。說明 當我們在網頁中有一些特殊字元時候,可以考慮使用字元實體 char entity html超連結 href mailto 電子郵箱位址 版權符號 font size 7 font br font...

HTML實體與網頁編碼

漢字都轉化為了html實體 十進位制表示的unicode編碼 這樣做的好處就是不管網頁的編碼是什麼,都可以正常的顯示漢字,而不會出現亂碼,當然也適用於其他字符集。在php中我們可以用mbstring的mb convert encoding函式實現這個正向及反向的轉化。如 mb convert enc...

《HTML 符號實體參考手冊》

本字元實體參考手冊包括了數學符號 希臘字元 各種箭頭記號 科技符號以及形狀。注釋 實體名稱對大小寫敏感。字元實體編號 實體名稱描述 for all part exists empty nabla isin notin ni prod sum minus lowast square root prop...