with
open
('統計單詞個數.txt'
,'r'
,encoding=
'utf-8'
)as f:
new_lines=
'' all_the_lines=f.readlines(
)for every_line in all_the_lines:
for i in
range(0
,len
(every_line)):
iford
(every_line[i]
)<
65or
ord(every_line[i]
)>
122:
new_lines=new_lines+
' 'else
: new_lines=new_lines+every_line[i]
new_lines=new_lines.lower(
) words=new_lines.split(
" ")
'''倒序迴圈,從最後乙個元素迴圈到第乙個元素。
不能用正序迴圈,因為正序迴圈刪除元素後,
後續的列表的長度和元素下標同時也跟著變了'''
for i in
range
(len
(words)-1
,-1,
-1):
if words[i]
==''
: words.pop(i)
dic=
for j in words:
if j in dic:
dic[j]+=1
else
: dic[j]=1
list1=
list
(dic.items())
list1.sort(key=
lambda x:
(x[1
],x[0]
),reverse=
true
)for k in
range(0
,len
(list1)):
if k<20:
print
(list1[k]
)
Python 合併多個TXT檔案並統計詞頻的實現
邏輯很清晰簡單,不算難,使用 python 讀取多個 txt 檔案,將檔案的內容寫入新的 txt 中,然後對新 txt 檔案進行詞頻統計,得到最終結果。程式設計客棧 如下 在windows 10,python 3.7.4環境下執行通過 coding utf 8 import re import os...
python讀取txt檔案中的資料
讀取txt檔案中的某一列 int l.split 0 for l in open a.txt 但是讀不了最後一列,出現 indexerror list index out of range的問題。參考 講的很詳細,對於這樣的問題 每行有3列,依次讀取,空格間隔,分別將每行的不同列存到不同的陣列a,b...
python提取txt檔案中的資料
從儲存在txt檔案中的30000多條資料當中提取自己需要的資訊,如下圖示例的資料格式,需要提取出now後的數值並儲存在另外乙個txt檔案當中。結果示例 r as f 開啟檔案 data f.read 讀取檔案 path w r c now 1.txt with open path w,w as f ...