詞頻統計及其效能分析

2022-08-17 21:39:18 字數 1550 閱讀 9530

---恢復內容開始---

1)2) 程式分析

1、 開啟並讀取檔案

【2、新增處理 bvffer**,統計單詞的頻率,存放在word_freq

def process_buffer(bvffer):

if bvffer:

word_freq = {}

# 下面新增處理 bvffer**,統計單詞的頻率,存放在word_freq

for item in bvffer.strip().split():

word = item.strip(punctuation+' ')

if word in word_freq.keys():

word_freq[word] += 1

else:

word_freq[word] = 1

return word_freq

3、設定輸出函式,進行排序並輸出top 10 的單詞

def output_result(word_freq):

if word_freq:

sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=true)

for item in sorted_word_freq[:10]: # 輸出 top 10 的單詞

print(item)

4、利用main方法輸出

if __name__ == "__main__":

import argparse

parser = argparse.argumentparser()

parser.add_argument('dst')

args = parser.parse_args()

dst = args.dst

bvffer = process_file(dst)

word_freq = process_buffer(bvffer)

output_result(word_freq)                    】由於電腦原因沒有截圖

3) 效能分析結果及改進。

程式執行命令、執行結果截圖

用命令python word_freq.py gone_with_the_wind.txt

執行:

呼叫最多312次

最長用時0.003

4) 程式執行命令、執行結果截圖以及改進後的程式執行命令及結果截圖 。電腦挺快的

5) 給出你對此次任務的總結與反思。

---恢復內容結束---

詞頻統計及其效能分析

1.匯入正規表示式 re模組 和string模組中的punctuation方法 import re from string import punctuation 2.開啟檔案讀入緩衝區 def process file dst 讀檔案到緩衝區 try 開啟檔案 fi1e open dst,r exc...

C 詞頻統計 效能分析

在鄒老師的效能分析的建議下對上次寫過的詞頻統計的程式進行分析改進。效能分析 個人很淺顯的認為就是程式的執行效率,的執行效率 1.vs 提供了自帶的分析工具 performance tool 效能分析 先看一下vs工具的自己介紹 診斷應該程式的效能問題 識別應用程式中最常見的高開銷方法。perform...

分析「詞頻統計「專案程序

目錄 功能需求 實現 psp功能需求 1.小檔案輸入 2.支援命令列輸入英文作品的檔名 3.支援命令列輸入儲存有英文作品檔案的目錄名,批量統計 4從控制台讀入英文單篇作品 實現 本次 實現了功能3。類名功能 void main string 主函式,呼叫其他函式實現基本功能 void sortmap...