使用python統計單詞出現的個數

最近在看python指令碼語言，指令碼語言是一種解釋性的語言，不需要編譯，可以直接用，由直譯器來負責解釋。python語言很強大，而且寫起來很簡潔。下面的乙個例子就是用python統計單詞出現的個數。

import sys
import string
#import collections
if len(sys.argv) == 1 or sys.argv[1] in :
print("usage: uniqueword filename_1 filename_2 ... filename_n")
sys.exit()
else:
words = {} 
# words = collections.defaultdict(int)
strip = string.whitespace + string.punctuation + string.digits + "\"'"
for filename in sys.argv[1:]:
for line in open(filename):
for word in line.split():
word = word.strip(strip)
if len(word) >= 2:
words[word] = words.get(word, 0) + 1
# words[word] += 1
for word in sorted(words):
print("'' occurs  times".format(word,words[word]))

假設檔名是 uniqueword.py，在命令列下輸入： uniqueword.py filename_1 filename_2 ... filename_n中單詞出現的次數可以被統計出來。

第四行和第五行判斷是否有輸入引數，如果輸入引數為空或者為-h， -help，則輸出幫助資訊。

從第七行到第14行是核心部分，逐一開啟引數中指定的檔案，並讀取每一行，再用字串的split方法把讀取的行抽取出乙個乙個的單詞，但單詞長度大於2的時候，把此單詞加入到字典words中。其中words.get(word, 0)的意思是取出key等於word的value，如果key為空，則把value置為預設值0. 最後列印出結果。

使用python統計單詞出現的個數

python統計單詞出現次數

統計單詞出現的頻率

統計單詞出現頻率

使用python統計單詞出現的個數

python統計單詞出現次數

統計單詞出現的頻率

統計單詞出現頻率

相關推薦