最近專案中用到了簡單的簡繁轉換,如果用opencc
太重了,於是搜到了 zhconv 這個庫。
zhconv提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換,python 2, 3 通用。
支援以下地區詞轉換:
正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。
而且雖然該專案stars很少,但中途發現作者還參與過維護jieba分詞。
呼叫也非常簡單
>>>
from zhconv import convert
>>> convert('python是一種動態的、物件導向的指令碼語言', 'zh-hant')
'python是一種動態的、物件導向的指令碼語言'
複製**
支援對地區化詞語的轉換
>>> convert('計算機軟體', 'zh-tw')
'計算機軟體'
>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字轉換
'計算機軟體'
>>> convert('計算機軟體', 'zh-cn')
'計算機軟體'
複製**
支援 mediawiki 人工轉換語法
>>>
from zhconv import convert_for_mw
>>> s = '張國榮曾在英國--大學學習。'
>>> convert_for_mw(s, 'zh-hans')
'張國榮曾在英國利茲大學學習。'
>>> convert_for_mw(s, 'zh-hk')
'張國榮曾在英國列斯大學學習。'
>>> convert_for_mw(s, 'zh-tw')
'張國榮曾在英國里茲大學學習。'
複製**
當然對於複雜高精度的轉換需求,還是建議用專業的opencc
開源庫:
Python 輕量化簡繁轉換
最近專案中用到了簡單的簡繁轉換,如果用opencc太重了,於是搜到了 zhconv 這個庫。zhconv提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換,python 2,3 通用。支援以下地區詞轉換 正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。而且雖然該專案stars很少,...
簡繁轉換如此簡單
public function strconv byval str as string,byval conversion as microsoft.visualbasic.vbstrconv,optional byval localeid as integer 0 as string 成員屬於 mi...
HanLP極致簡繁轉換
談起簡繁轉換,許多人以為是小意思,按字轉換就行了。事實上,漢語歷史悠久,地域複雜,發展至今在字元級別存在 一簡對多繁 和 一繁對多簡 在詞語級別上存在 簡繁分歧詞 在港澳台等地則存在 字詞習慣不同 的情況。為此,hanlp新增了 簡體 繁體 台灣正體 香港繁體 間的相互轉換功能,力圖將簡繁轉換做到極...