Linux的某一種純終端中文顯示和輸入方案

2021-06-05 09:02:20 字數 1199 閱讀 1952

純終端裡的中文解決方案,我能想到的最近的是zhcon,已經是多少年以前的事情,我自己都不記得,那時候覺得挺牛b,現在找到另乙個解決方案:univt+uim-fep。

youbest創作的utf-8補丁相容性特別好,目前的名字就是univt,參考目前作者更新到3.2.1的核心,但沒有找到鏈結,用的是2.6.39,這是2.6最新的核心了。

先給核心打補丁和字型補丁

patch -np1 -i ../utf8-kernel-2.6.39-core-1.patch

patch -np1 -i ../utf8-kernel-2.6-fonts-3.patch

然後,在make menuconfig裡選擇vga vesa的驅動,以及framebuffer驅動,還有8x16的終端字型

uim參考**最新的stable版是1.7.3,直接編譯安裝,不需要什麼引數

./configure

make

make install

預設安裝在/usr/local裡,注意。

要正常使用uim-fep還需要修改乙個地方,否則ctrl+空格呼不出輸入法

vi /usr/local/share/uim/generic-key-custom.scm

把: (define-custom 'generic-on-key '("zenkaku-hankaku" "")

(define-custom 'generic-off-key '("zenkaku-hankaku" "")

改為:

(define-custom 'generic-on-key '("zenkaku-hankaku" "")

(define-custom 'generic-off-key '("zenkaku-hankaku" "")

重新引導新編譯的核心,執行uim-fep -u py會啟動拼音輸入法,在螢幕最下面有顯示,中文拼音不能連續打,乙個個輸入吧,總比沒有強。鍵盤上下鍵選字,翻頁還不會。

uim-fep還提供其他很多的輸入法

效果還是不錯的:

中文編碼的一種用法

這裡通過乙個測試某些ip位址是否為特定 的例子來說明。我們假設該 的編碼用的是gb2312,並通過獲取該 的title作為檢測依據。usr bin env python encoding utf 8 略去獲取網頁的 re.ignorecase title 論壇標題 m re.search title...

KTDictSeg 一種簡單快速準確的中文分詞方法

個人部落格 2007 5 南京 基本技術指標 分詞準確度 90 以上 只是自己統計了一下,有待專家的權威評測 處理速度 600kbytes s p4 3.0g 和網際網路上幾個比較流行的中文分詞方法的比較 和sharpictclas的比較 提到中文分詞,就不能不提到計算所開發的ictclas 中文分...

python中文數字轉數值的一種實現

python中,str.isnumeric可以判別字串是否為數字,包括中文字元也可以正常判斷,例如 str.isnumeric 伍拾叄 str.isnumeric 五十三 結果都返回true 但對於這些unicode的字元,單個字元可以通過unicodedata.numeric轉換為數值,長字串就不...