pip install zhconv
zhconv 提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換。python 2, 3 通用。支援以下地區詞轉換:
zh-cn 大陸簡體
zh-tw 台灣正體
zh-hk 香港繁體
zh-sg 馬新簡體
zh-hans 簡體
zh-hant 繁體
正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。
而且雖然該專案stars很少,但中途發現作者還參與過維護jieba分詞。
呼叫也非常簡單
>>
>
from zhconv import convert
>>
> convert(
'python是一種動態的、物件導向的指令碼語言'
,'zh-hant'
)'python是一種動態的、物件導向的指令碼語言'
支援對地區化詞語的轉換
>>
> convert(
'計算機軟體'
,'zh-tw'
)'計算機軟體'
>>
> convert(
'計算機軟體'
,'zh-hans'
)# zh-hans只是逐字轉換
'計算機軟體'
>>
> convert(
'計算機軟體'
,'zh-cn'
)'計算機軟體'
支援 mediawiki 人工轉換語法
>>
>
from zhconv import convert_for_mw
>>
> s =
'張國榮曾在英國--大學學習。'
>>
> convert_for_mw(s,
'zh-hans'
)'張國榮曾在英國利茲大學學習。'
>>
> convert_for_mw(s,
'zh-hk'
)'張國榮曾在英國列斯大學學習。'
>>
> convert_for_mw(s,
'zh-tw'
)'張國榮曾在英國里茲大學學習。'
簡繁體轉換
這篇文章的題目應該叫中文 中國大陸 中文 中國台灣 字符集的轉換。因為如果僅僅是簡繁體的轉換,那麼友好多的文章都叫你去呼叫microsoft.visualbasic.strings.strconv,殊不知,他只是把中文 中國大陸 中的簡體字轉換成了中文 中國大陸 中的繁體字,這是治標不治本的做法。下...
Python實現簡繁體轉換
如今,世界上存在兩種中文,一種是中文簡體,一種是中文繁體。如果要完全掌握中文語言的自然語言處理,那麼簡繁都不可避免。所以,掌握了簡體與繁體的轉換,往往能夠事半功倍。而hanlp也提供了簡繁轉換的類 chartable,用它來執行字元正規化。比如簡體轉換繁體,全形轉換半形,大寫轉換小寫,都可以使用該類...
php簡繁體轉換
實現簡體轉繁體,繁體到轉體 2007 12 27 16 34 function gb2big5 text else text i gb 0 text i 1 gb 1 i fclose fp return text 簡體轉繁體 end 繁體轉簡體 start function big52gb tex...