第一種方法
import sys
import unicodedata
s = "l zhu w"
remap =
# 去除\t, \f, \r
a = s.translate(remap)
''' 通過使用dict.fromkeys() 方法構造乙個字典,每個unicode 和音符作為鍵,對於的值全部為none
然後使用unicodedata.normalize() 將原始輸入標準化為分解形式字元
sys.maxunicode : 給出最大unicode**點的值的整數,即1114111(十六進製制的0x10fff
unicodedata.combining:將分配給字元chr的規範組合類作為整數返回。 如果未定義組合類,則返回0。
'''cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) www.cppcns.com#此部分建議拆分開來理解
b = unicodedata.normalize('nfd', a)
''' 呼叫translate 函式刪除所有重音符
'''print(b.translate(cmb_chrs))
第二種方法 (推薦)
import unicodedata
mystr='l zhu w'
unicodedata.normalize('nfkd', mystr).epslmljgrbuncode('ascipslmljgrbui','ignore')
本文標題: python去除拼音聲調字母,替換為字母的方法
本文位址:
python漢字轉換為拼音
使用pypinyin包 pip install pypinyin from pypinyin import pinyin,normal 將漢字轉換為拼音,pinyin 轉換後是列表,不加style轉換後帶聲調 pos 1 for piny in pinyin self.name,style norm...
python直接把漢字轉換為拼音
萬能pip安裝pinyin庫 2 起鍋燒油開始炒菜 基本呼叫 pinyin.get 天地君親師!3 其他佐料 如果想要兩個拼音之間有分隔符分開,可以使用delimitrer引數。比如可以設定空格 pinyin.get 天地君親師 delimiter 很多時候,這樣的符號並不適合計算機來讀取。form...
python 漢字轉拼音 獲取首字母
方式 一 通過第三方庫 import pinyin print pinyin.get 漢字 獲取首字母,可將中文字串轉為中文列表 然後獲取每乙個漢字的拼音字串取第乙個然後拼接即可 print pinyin.get 漢 0 方式 二 通過編碼對比 def single get first unicod...