pymmseg 安裝方法以及亂碼解決

2022-07-21 04:12:09 字數 899 閱讀 4501

從這個命令列視窗進入pymmseg/mmseg-cpp資料夾。輸入python build.py,回車

編寫程式如下

#

coding:utf-8

from pymmseg import

mmseg

mmseg.dict_load_defaults()

text = '

今天我真的好開心

'algor =mmseg.algorithm(text)

for tok in

algor:

print

'%s [%d..%d]

'%(tok.text,tok.start,tok.end)

執行後會出現亂碼,這是因為mmseg支援的是utf8, windows的本地預設編碼是cp936,也就是gbk編碼

將**改寫如下即可

#

coding: utf-8

from pymmseg import

mmseg

mmseg.dict_load_defaults()

text = '

今天我真的好開心

'algor =mmseg.algorithm(text)

for tok in

algor:

print

'%s [%d..%d]

' % (tok.text.decode('

utf-8

').encode('

gbk'), tok.start, tok.end)

Nginx簡介以及安裝方法

反向 反向 伺服器位於使用者與目標伺服器之間,但是對於使用者而言,反向 伺服器就相當於目標伺服器,即使用者直接訪問反向 伺服器就可以獲得目標伺服器的資源。同時,使用者不需要知道目標伺服器的位址,也無須在使用者端作任何設定。反向 伺服器通常可用來作為web加速,即使用反向 作為web伺服器的前置機來降...

Qt 中文亂碼原因以及解決方法

自 本文主要分析了基於windows系統msvc2013編譯器的qt中文亂碼。概念 字型檔表 是乙個系統支援的文字,符號,數字的集合。編碼字符集 字符集 我們平時所說的字符集就是這個,計算機以二進位制的形式儲存字元,每個字元對應的二進位制編碼不同,而編碼字符集就是所有編碼與字元的對映集合。例如 在a...

MySql安裝過程以及中文亂碼解決辦法

每次裝完都忘記,乾脆記錄一下,哈哈哈,下次裝機的時候就不用乙個乙個的找了。mysql安裝 解壓之後直接就可以使用,配置各種環境變數 1.如果解壓後沒有data目錄 開啟cmd命令視窗,並且進入到mysql安裝目錄的bin目錄下。然後輸入命令 mysqld initialize insecure us...