思路:首先要讀取英文文字.txt,然後對讀取文字進行「空格化」,方便單個單詞的識別,最後將資料寫入新文字中。
**如下
import collections
with open
('test.txt'
,'r'
,encoding=
'utf-8'
) as f:
string=f.
read()
.split
(' '
)text = collections.
counter
(string)
with open
('result.txt'
,'w'
) as r:
for key,value in text.
items()
: r.
write
(key+
':'+
str(value)
+'\n'
)
執行
然後可以在相應的python當前執行程式資料夾中找到生成文字,我的是e盤。
成功
ps:要注意的是encoding=『utf-8』是不能省略的,不然會出現gkb的warning,即如下錯誤:
統計乙個英文文字的單詞出現的頻率(有標點符號的)
該程式為單詞頻率統計,可讀取乙個英文文字檔案 含標點符號 可在螢幕上輸出個單詞在英文文字中出現的次數。詞頻統計 汪強 include include include define i 1000 int b struct word s i void file1 讀出檔案內的單詞 while feof ...
任乙個英文的純文字檔案,統計其中的單詞出現的個數
import re with open a.txt r as f total f.readlines 讀取文字檔案的每一行 s 用於儲存單詞以及單詞的個數 for line in total 對每一行進行單詞識別 a re.findall r a z a z line 具體參考re模組的使用 for...
統計乙個文字的字元 單詞數
文字操作是最常見的,以例子的形式來驅動程式的編寫 encoding utf 8 import time keep defnormalize s 大寫轉換成小寫,並且剔除數字等開頭或不在列表中的字元,返回正常字串 result for c in s.lower if c in keep result ...