繁體與簡體的轉換,目前常用的工具包是opencc。
通過上網搜尋與研究測試。目前有兩種方式進行轉換,一種是python呼叫opencc的形式,一種是linux內直接命令列操作。
通過兩種方式的測評,python下執行速度極慢,linux下轉換速度相當快。
一、linux安裝與使用:
二、windows中python下安裝使用:
修改檔案:python36\lib\site-packages\opencc\__init__.py(該路徑根據自己實際情況而定)
也就是將from version那一句注釋掉,增加version的預設值設定。
#from version import __version__
__version__ = '0.1'
呼叫示例:
# -*- coding: utf8 -*-
import opencc
import codecs
def write_txt(file_name, line):
with codecs.open(file_name, 'a', encoding='utf-8') as f:
f.write(line)
if __name__ == '__main__':
# cc = opencc.opencc('t2s')
# print(cc.convert(u'open chinese convert(opencc)「開放中文轉換」,是乙個致力於中文簡繁轉換的專案,提供高質量詞庫和函式庫(libopencc)。'))
old_file = '../doc/as_testing_gold.utf8'
cc = opencc.opencc('t2s')
with codecs.open(old_file, mode='r', encoding='utf-8') as f:
with codecs.open('../doc/as_testing_gold_cn.txt', mode='w', encoding='utf-8') as out:
lines = f.readlines()
count = 0
for line in lines:
# print(cc.convert(line))
count += 1
if count % 1000 == 0:
print(count)
out.write(cc.convert(line))
簡體轉換繁體
vb.net strconv 函式介紹 public shared function strconv byval str as string,byval conversion as microsoft.visualbasic.vbstrconv,optional byval localeid as ...
C 簡體繁體轉換
簡體轉繁體 轉換內容 繁體 public static string convertbig5 string convertext 繁體轉簡體 轉換內容 簡體 public static string convertgb2312 string convertext 將繁體亂碼轉繁體 已經是big5編碼...
中文簡體與繁體的轉換
雖然說中文繁體與簡體的轉換在專案中使用到的概念很小,但是這也算是乙個有工具類了,為了以後可能的需要,在這裡說一下 package com.iflytek.zjfconverter import com.spreada.utils.chinese.zhconverter author xudongwa...