結巴分詞後,希望通過字典來統計所有分詞出現的次數並對幾個高頻詞彙作相應的操作,但有編碼問題。
在對中文文字進行開啟 讀取 分詞之後,jieba.lcut()返回了乙個list,迴圈list並對list中每乙個分詞出現的次數進行統計,建立乙個字典來儲存分詞與次數的鍵值對。
發現在python2.7下,這樣建立乙個字典,print時是有問題的,附上乙個連線:
d =
所以下面這段**執行時都是錯誤的,列印ls可以看到,list當中都是中分分詞,列印d的時候就可以看到所有的key都不是中文。
# -*- coding: utf-8 -*-
import jieba
try:
f = open("firstfile.txt", "r")
mystr = f.read()
f.close()
ls = jieba.lcut(mystr,cut_all=true)
d={}
for w in ls:
d[w] = d.get(w,0)+1
for k in d:
if d[k] >= 50 and k != "\n" and k != "":
print('"{}"出現{}次'.format(k,d[k]))
except:
print("error")
wget
解壓
tar -xvf python-3.3.0.tar
進入解壓縮後的資料夾
cd python-3.1.2
在編譯前先在/usr/local建乙個資料夾python3(作為python的安裝路徑,以免覆蓋老的版本,當然也可以安裝多個版本python)
mkdir /usr/local/python3
開始編譯安裝
./configure --prefix=/usr/local/python3
make
make install
此時沒有覆蓋老版本,再將原來/usr/bin/python鏈結改為別的名字
mv /usr/bin/python /usr/bin/python_old
再建立新版本python的鏈結
ln -s /usr/local/python3/bin/python3 /usr/bin/python
QWebEngineView無法輸入中文
1 qt版本問題 網上能查到的大部分是無法輸入中文的答案都是qt5.8的bug,然後在5.9已經修復。如果你是5.8版本那麼可能就是這個問題,請更換版本。2 輸入法問題 這也是困擾我1天的問題,最後定位到是fcitx輸入法的問題,同樣是qt5.9.8在windows下表現正常,但是在linux下卻不...
T無法輸入中文
一 qt creater無法輸入中文 搜狗輸入法 sudo apt get install fcitx frontend qt5 sudo apt get install libfcitx libs qt5 1 找到這個動態庫 usr lib x86 64 linux gnu qt5 plugins...
idea properties檔案中文無法正常顯示
引用 問題 在idea開啟配置檔案,已經設定了全域性編碼格式為utf 8,和專案編碼格式為utf 8,但是中文依然不能正常顯示 如config.properties,裡面中文注釋顯示為utf8字元編碼數字 解決方法 file settings editor file encodings 如下圖設定 ...