對於字元編碼的理解

2022-08-03 06:00:17 字數 653 閱讀 3946

1.對於ascii碼的理解

採用乙個位元組來表示英文、數字的符號,將其與二進位制一一對應,位元組第一位為0,共編制128個符號,其中32個不能列印出來

2.非ascii編碼

由於乙個位元組可以表示256個字元,前0-127還是當時美國所表示的符號,各個國家根據自己的符號,編制屬於自己的128-256位符號,但是這樣還是存在問題,無法全部表示。所以出現漢字採用兩個位元組來進行編碼gb2312,理論上可以表示256*256=65536個符號

3.unicode編碼

為了解決這種每個國家都有自己編碼規則的問題,希望出現一種涵蓋所有符號的編碼集,這就是unicode編碼,但是由於該編碼方式只是將符號與二進位制一一對應,對於計算機無法知道應該用幾個位元組來解釋這種二進位制表示,所有如果採用三四個位元組表示符號,會出現其他位元組位的浪費。

4.utf-8

為了解決這樣的問題,出現了變長編碼方式來解決這樣的問題。

utf-8規定可以用二進位制開頭的1的個數規定該符號採用的幾個位元組編碼儲存。

對於RestFul編碼風格的理解

resultful風格 restful風格是一種資源定位以及資源操作的風格。它既不是某種必須遵循的標準,也不是大家都不能改動的協議,而是一種編碼風格。當我們在實際的業務開放當中使用到restful風格時,會使得我們的業務進展速度很大程度度的提高。主要功能 get 用於查詢資源 post 用於建立資源...

對於檔案編碼格式的淺顯理解

字型亂碼這個問題相信很多人都遇到過,但是都是間歇性的,不是經常性的,大多時候都沒有太在意。在遇到過這麼多次亂碼之後,特別是在linux下開啟windows的檔案亂碼,我覺得有必要了解一下編碼方式了。首先,計算機內部只能儲存二進位制資料,即1和0的bit位。所以,我們要讓計算機顯示各種字元,就必須要對...

對於頁面編碼導致亂碼的理解

以前也遇到過不只一次的編碼不一致的問題,今天和 laruence 前輩學習了一下,終於明白了其中的一些東西 1.檔案有自己的編碼 比如windows下的ansi 或是utf8 2.apache有乙個defaultcharset 3.程式中可以規定返回的編碼格式,如php中的 header conte...