C 過濾控制字元(SOH DLE EOT)等

2022-02-24 17:36:16 字數 508 閱讀 7005

從裝置採集到資訊,有時候結尾會帶些特殊字元,經常還是不可見字元,不過複製到notepad++,會顯示(soh)(dle)(eot)等,查詢後才知道這些是ascii中的控制字元。

控制字元(control character),出現於特定的資訊文字中,表示某一控制功能的字元。

在ascii碼中,第0~31號及第127號(共33個)是控制字元或通訊專用字元,如控制符:lf(換行)、cr(回車)、ff(換頁)、del(刪除)、bs(退格)、bel(振鈴)等;通訊專用字元:soh(文頭)、eot(文尾)、ack(確認)等。

soh是start of heading的縮寫:

c#採集後儲存到資料庫中,需要過濾這些字元,**如下:

///

/// 過濾不可見字元

///

/// 原始字元

/// 刪除後結果

參考: 

php過濾ascii控制字元

還記得以前在工作中,將爬來的其它 的資料導到xml。但是會遇到乙個問題 即網頁會有ascii的控制字元。一開始以為是別人為了防止採集而加入的,然後發現乙個就往過濾表裡加乙個。直到慢慢發現,他們都是ascii表裡的字元。找到原因了,就好解決了。根據ascii碼過濾控制字元 param type str...

Ascii控制字元

內建函式ord 和chr ord 27 chr 27 x1b 二進位制十進位制 十六進製制 縮寫可以顯示的表示法 名稱 意義 0000 0000000 nul 空字元 null 0000 0001101 soh 標題開始 0000 0010202 stx 本文開始 0000 0011303 etx ...

Unix的控制字元

控制字元 修改終端或文字顯示的行為.控制字元以control key 組合.控制字元在指令碼中不能正常使用.ctl b游標後退,這應該依賴於bash 輸入的風格,預設是emacs 風格的.ctl cbreak,終止前台工作.ctl d從當前shell 登出 和exit 很像 eof 檔案結束符 這也...