HTML的檔案結構及字符集與編碼

2021-10-10 16:02:22 字數 826 閱讀 9202

用html語言編寫網頁的時候,檔案儲存為字尾為.htm或者是.html的網頁檔案。這樣的檔案具有以下基本結構:

最外層由包裹,表示檔案由開始,到結束,在此之中由html語法規範來規定。

標籤之中,第一部分是由標籤包裹,表示網頁頭部資訊,指的是網頁針對瀏覽器和搜尋引擎提供的一些資訊。內部包含如標籤。

標籤之中,第二部分是由標籤包裹,表示網頁的主題內容。

基本結構為:

>

//html檔案宣告開始

>

charset

="utf-8"

/>

//定義編碼

>

網頁標題title

>

//定義標題

head

>

>

檔案體body

>

html

>

編碼:用來將字元和二進位製碼對應。比如:a的ascii編碼為01000001

常見的編碼方式有:

ascii:數字、英文本母、符號進行了編碼

gb2312:簡體中文

unicode:所有語言,但是占用記憶體較大

utf-8:所有語言,占用空間小

亂碼問題

當原始檔儲存時的編碼和原始檔宣告不一致時,就會出現亂碼問題。

編碼字符集與字符集編碼的區別

無論歷史上的ucs還是現如今的unicode,兩者指的都是編碼字符集,而不是字符集編碼。乙個抽象字符集其實就是指字元的集合,例如所有的英文本母是乙個抽象字符集,所有的漢字是乙個抽象字符集,在給乙個抽象字元集合中的每個字元都分配乙個 整數編號之後 注意這個整數並沒有要求大小 這個字符集就有了順序,就成...

你不知道的 字符集和編碼(編碼字符集與字符集編碼)

我的上篇文章,有朋友提出字符集和編碼的區別,我在此立文和大家討論下 常說的字符集和編碼區別,其實就是編碼字符集和字符集編碼的區別,其實,單單如果只是說字符集,沒有任何編碼的概念的話,那麼字符集其實僅僅是乙個簡單的字元的集合,或者說是乙個抽象的字元的集合,包括文字,符號等等,不參與任何儲存形式,只是存...

Linux字符集的檢視及修改

一 檢視字符集 字符集在系統中體現形式是乙個環境變數,以centos6.5為例,其檢視當前終端使用字符集的方式可以有以下幾種方式 第一種 1 root ciro echo lang 2zh ch utf 8 第二種 1 root ciro env grep lang 2lang zh cn.utf ...