純終端裡的中文解決方案,我能想到的最近的是zhcon,已經是多少年以前的事情,我自己都不記得,那時候覺得挺牛b,現在找到另乙個解決方案:univt+uim-fep。
youbest創作的utf-8補丁相容性特別好,目前的名字就是univt,參考目前作者更新到3.2.1的核心,但沒有找到鏈結,用的是2.6.39,這是2.6最新的核心了。
先給核心打補丁和字型補丁
patch -np1 -i ../utf8-kernel-2.6.39-core-1.patch
patch -np1 -i ../utf8-kernel-2.6-fonts-3.patch
然後,在make menuconfig裡選擇vga vesa的驅動,以及framebuffer驅動,還有8x16的終端字型
uim參考**最新的stable版是1.7.3,直接編譯安裝,不需要什麼引數
./configure
make
make install
預設安裝在/usr/local裡,注意。
要正常使用uim-fep還需要修改乙個地方,否則ctrl+空格呼不出輸入法
vi /usr/local/share/uim/generic-key-custom.scm
把: (define-custom 'generic-on-key '("zenkaku-hankaku" "")
(define-custom 'generic-off-key '("zenkaku-hankaku" "")
改為:
(define-custom 'generic-on-key '("zenkaku-hankaku" "")
(define-custom 'generic-off-key '("zenkaku-hankaku" "")
重新引導新編譯的核心,執行uim-fep -u py會啟動拼音輸入法,在螢幕最下面有顯示,中文拼音不能連續打,乙個個輸入吧,總比沒有強。鍵盤上下鍵選字,翻頁還不會。
uim-fep還提供其他很多的輸入法
效果還是不錯的:
中文編碼的一種用法
這裡通過乙個測試某些ip位址是否為特定 的例子來說明。我們假設該 的編碼用的是gb2312,並通過獲取該 的title作為檢測依據。usr bin env python encoding utf 8 略去獲取網頁的 re.ignorecase title 論壇標題 m re.search title...
KTDictSeg 一種簡單快速準確的中文分詞方法
個人部落格 2007 5 南京 基本技術指標 分詞準確度 90 以上 只是自己統計了一下,有待專家的權威評測 處理速度 600kbytes s p4 3.0g 和網際網路上幾個比較流行的中文分詞方法的比較 和sharpictclas的比較 提到中文分詞,就不能不提到計算所開發的ictclas 中文分...
python中文數字轉數值的一種實現
python中,str.isnumeric可以判別字串是否為數字,包括中文字元也可以正常判斷,例如 str.isnumeric 伍拾叄 str.isnumeric 五十三 結果都返回true 但對於這些unicode的字元,單個字元可以通過unicodedata.numeric轉換為數值,長字串就不...