詳細題目在上。此次是0006題,統計出乙個資料夾下每個文字檔案最為重要的詞。
總的思路是讀取檔案目錄,將所有檔案加至列表中,然後對列表每個檔案中的文字進行過濾,使用字典
計算詞出現次數,然後對字典排序,將出現次數最多的詞存到乙個列表中,最後輸出該列表。
# -*- coding: utf-8 -*-
import os
import re
#將資料夾中的檔案放入乙個列表中,如果是子資料夾則忽略。
def getfile(directory):
list = os.listdir(directory)
filelist =
for item in list:
filepath = os.path.join(directory,item)
if not os.path.isdir(filepath):
return filelist
#對於列表中的每個txt檔案,都讀取檔案內容
#然後使用正規表示式過濾除了英文本母外所有字元,然後將其切割為乙個英文單詞列表
#接著將單詞變為小寫,使用字典來計算單詞出現次數
#最後將字典按大到小排序,然後取字典中的第乙個英文單詞,加入到乙個列表中,最後返回該列表
def calculator(filelist):
importantword =
for temp in filelist:
with open(temp, 'r') as file:
word = re.sub(r'[^a-za-z]',' ',unicode(file.read().split()))
word = word.split()
word_dict = {}
for item in word:
item = item.lower()
if not item in word_dict:
word_dict[item] = 1
else :
word_dict[item] += 1
word_dict = sorted(word_dict.iteritems(),key=lambda d:d[1],reverse=true)
theword, value = word_dict[0]
return importantword
#列印每個文字檔案最重要的詞
list = getfile('txt')
calculator(list)
for item in calculator(list):
print item
健康最重要
上午去華油開了兩個多小時的會,等會議結束,已經十二點半了。打車回公司,匆匆吃了碗小牛,辣了吧唧的幾口就沒食慾了。回到公司,見到了同事,同時得知一條不好的訊息 同事的老爸得病了,要做骨頭移植的手術。聽了心裡挺難受的,不知道說什麼安慰的話。同事跟我做乙個專案,為人實在,超級能喝酒,只要我在公司,就我們哥...
人生什麼最重要
人生什麼最重要 在 再努力也燒不開一壺水,說明環境很重要。騎自行車,再努力也追不上寶馬,說明平台很重要。男人,再優秀,沒女人也生不下孩子,說明合作很重要。乙個人,再有能力,也幹不過一群人,說明團隊很重要。想有保障,買再大的水桶都不如挖一口井,說明管道很重要。想要五福臨門,唯有相信因果,注重德修,厚德...
最重要的小事
最重要的小事 作詞 阿信 作曲 瑪莎 我 走過動盪日子 追過夢的放肆 穿過多少生死 卻 假裝若無其事 穿過半個城市 只想看你樣子 這一刻 最重要的事 是屬於你 最小的事 世界紛紛擾擾喧喧鬧鬧 什麼是真實 為你跌跌撞撞傻傻笑笑 買一杯果汁 就算庸庸碌碌匆匆忙忙 活過一輩子 也要分分秒秒年年日日 全心守...