python實現WordCount 第三次作業

2021-09-24 15:54:19 字數 2094 閱讀 4681

在完成本次作業的期間,同一位同學進行了合作,大概就是相互之間測試對方的程式,已達到軟體測試的目的。

1.在進行檔案操作的時候報錯,經分析報錯後發現是在開啟某一檔案時未統一編碼規範。檔案是gbk編碼,在開啟檔案的時候要轉化為utf-8。

2.對**的縮排,一些變數定義和空間進行了修改。

pychecker是python**的靜態分析工具,它能夠幫助查詢python**的bug,而且能夠對**的複雜度和格式等提出警告。

檢查模組:所有

檢查結果:

由於**是經過除錯和修改後才檢查的,且**量比較少,所以檢查的時候並不存在多大的問題。

2.1測試所有模組功能:

2.1.1 測試思路

輸入有效等價類

無效等價類

讀取檔案命令引數

(1)-l

(2)-w

(3)-c

(4)-c -w

(5)-l -c

(6)-w -c

(7)-l -w -c

(8)空

(9)非-l -w -o的任意其他引數

結果寫入檔案命令引數

(10)-o

(11)非-o的其他命令

檔名(12)源檔名

(13)非檔名

一共設計四個測試用例:

1.wc.py -c -w -l -e -a  -o output.txt test.txt 覆蓋①②③④⑤⑥⑦⑧⑩⑫

2.wc.py -f -t test.txt,測試⑨;

3.wc.py -l -w -c test.txt -h output.txt,測試⑪;

4.wc.py -l -w -c dir,測試⑬

2.1.2 覆蓋情況:語句覆蓋,判定覆蓋,條件覆蓋

2.2 附加高階功能測試

2.2.1 等價類劃分

輸入有效等價類

無效等價類

遍歷資料夾命令輸入

(1)-s

(2) 非-s 其他任意引數

停用表(3)-e

(4) 非-e其他任意引數

共設計三個個測試用例: 

python3 wc.py -s -c -w -l -a -e stoplist.txt -o output.txt *.py,覆蓋(1)(3) 

python3 wc.py -s *.py 測試(2)

python3 wc.py -l test.txt,測試(4)

2.2.2 語句覆蓋,條件覆蓋

1.1 安裝方法 :

python3中: python3 -m pip install locust

安裝成功後終端輸入locust --help顯示幫助資訊表示安裝成功

由於**量不是很大,且不存在資料庫連線操作和聯網的互動操作,所以測試效能結果較優。

通過本次的作業,初步認識到了到一些**檢查工具在對開發過程中的重要性,也體會到了在軟體開發過程中必須保持嚴謹的態度,也要有一定的「大局觀念」,才能在方便在軟體測試時對軟體的功能進行細化的測試。

同時合作也是至關重要的一環,兩個人相互之間的思考方式不同,邏輯思維也不同,這樣審查**也能發現一些**上的邏輯錯誤,減少bug的存在。其次**的規範和風格極其重要,良好的編碼習慣不僅會大大地提公升整個程式原始碼的可讀性,同時也會減少後期維護的成本,所以要在平時的練習中養成良好的編碼習慣。

關於Hadoop2 7 2執行wordcount

1.每次機器重啟後需要重新format否則namenode無法啟動的問題,解決辦法就是修改core site.xml,在你的hadoop安裝目錄新增臨時資料夾。hadoop.tmp.dir usr local hadoophome hadoop tmp 2.新建hdfs輸入資料夾input2。bin...

Spark使用UDF函式之WordCount實現

使用者定義函式 user defined functions,udfs 是大多數 sql 環境的關鍵特性,用於擴充套件系統的內建功能。udf允許開發人員通過抽象其低階語言實現來在更高階語言 如sql 中啟用新功能。apache spark 也不例外,並且提供了用於將 udf 與 spark sql工...

執行hadoop自帶的案例 wordcount

主要有四個步驟 一 在hdfs分布式檔案系統 中建立兩個資料夾,分別存放輸入 輸出資料 1 bin hadoop fs mkdir p data wordcount 建立的輸入資料目錄 2 bin hadoop fs mkdir p output 建立的輸出資料目錄 二 將要測試的檔案上傳到hdfs...