(一)檔案格式和編碼
檔案在計算機中都是以二進位制儲存的,這個想必大家都是知道的,既然都是用0和1儲存的,那為什麼記事本能夠開啟一些所謂的「txt檔案」,開啟標準的「grd檔案」時卻會是亂碼呢?這就是檔案格式的問題了。計算機中的檔案格式大致可以分為二進位制檔案(binary)和文字檔案(text),沒有十進位制檔案。前者是無格式的,也就是說沒有乙個統一的標準來規定資料如何儲存(檔案建立者自己規定格式),而文字檔案是有格式(編碼)的,英文本母和符號以ascii碼儲存,漢字以機器碼儲存。(不過最後都是以0和1存在磁碟的)正是因為文字檔案規定了編碼方式,所以記事本等軟體才能夠直接解析,不同的編碼方式對應的解析也不同,如果識別錯誤,同樣會造成亂碼,這個道理和記事本開啟二進位制檔案出現亂碼是一樣的。
下面可以做乙個簡單有趣的試驗,肯定有不少朋友看到過:
新建乙個文字檔案,用記事本開啟,然後在裡面輸入聯通 這兩個漢字,儲存並關閉記事本,接著,再用記事本開啟這個檔案,你會發現聯通 兩個字變成了亂碼!出現這一現象的原因就是windows對這個檔案的編碼識別錯誤,windows預設的是ansi編碼,但是由於這兩個漢字的內碼很特殊,再次開啟檔案時靠很少的資訊並不能夠完全確認檔案的編碼方式,導致編碼識別錯誤,出現亂碼。二進位制檔案並不是grads的專有,但是我們在日程的使用中通常會直接使用這個名詞,grads的二進位制檔案是grads規定了具體的格式,拿格點檔案來說,他的格式就非
常簡單,直接儲存4個位元組的實型數即可,而站點資料之所以寫入比較麻煩,是因為他包含了站點資訊,所以必須規定比較複雜的檔案排列方式,如果不按照規定的方式存入資料,那麼grads就不能識別這個二進位制檔案。
檔案字尾拓展名 檔案格式 擷取
file file new file d file.separator 1.xlsx string filename file.getname system.out.println filename.split 0 filename.substring 0,filename.lastindexof ...
Oracle 控制檔案格式ctl檔案格式
options skip 1,errors 10 load data characterset zhs16gbk infile into table table name truncate fields terminated by optionally enclosed by trailing nu...
檔案格式 gff格式
gff檔案格式 gff格式是 sanger 研究所定義,是一種簡單的 方便的對於 dna rna以及蛋白質序列的特徵進行描述的一種資料格式,已經成為序列注釋的通用格式,比如基因組的基因 許多軟體都支援輸入或者輸出gff格式。前格式定義的最新版本是版本3。原始定義見 song websitegff是存...