使用拼音庫xpinyin
import xpinyin
if __name__ ==
'__main__'
: p = xpinyin.pinyin(
) result =
[p.get_initials(a,'')
for a in
['上海'
,'武漢'
,'深圳']]
print
(result)
>>> from xpinyin import pinyin
>>> p = pinyin()
>>> # default splitter is `-`
>>> p.get_pinyin(u"上海")
'shang-hai'
>>> # show tone marks
>>> p.get_pinyin(u"上海", tone_marks='marks')
'shàng-hǎi'
>>> p.get_pinyin(u"上海", tone_marks='numbers')
>>> 'shang4-hai3'
>>> # remove splitter
>>> p.get_pinyin(u"上海", '')
'shanghai'
>>> # set splitter as whitespace
>>> p.get_pinyin(u"上海", ' ')
'shang hai'
>>> p.get_initial(u"上")
's'>>> p.get_initials(u"上海")
's-h'
>>> p.get_initials(u"上海", u'')
'sh'
>>> p.get_initials(u"上海", u' ')
's h'
如果方法中傳入變數,那麼直接加字首是不可以了。而是要將變數轉為utf-8編碼:
>>> wordvalue = '中國'
>>> wordvalue= unicode(wordvalue,'utf-8')
>>> s = p.get_initials(wordvalue, u'').lower()
'zg'
提取漢字首字母
using system using system.collections.generic using system.text namespace stringoption return mystr 把提取的字母變成大寫 需要轉換的字串 轉換結果 public static string getlo...
提取漢字首字母工具類
public class stringutil 存放國標一級漢字不同讀音的起始區位碼對應讀音 static final char firstletter 獲取乙個漢字的拼音首字母。gb碼兩個位元組分別減去160,轉換成10進製碼組合就可以得到區位碼 例如漢字 你 的gb碼是0xc4 0xe3,分別減...
漢字首字母
在很多軟體中,輸入拼音的首寫字母就可以快速定位到某個詞條。比如,在鐵路售票軟體中,輸入 bj 就可以定位到 北京 怎樣在自己的軟體中實現這個功能呢?問題的關鍵在於 對每個漢字必須能計算出它的拼音首字母。gb2312漢字編碼方式中,一級漢字的3755個是按照拼音順序排列的。我們可以利用這個特徵,對常用...