importoperator
import
string
f=open("
a.txt
","r")
a=f.read()
a1=f.read()
s=string.punctuation+string.digits
for i in s: #
標點符號換成空格
a=a.replace(i,"")
(s)print
(a)print
()print(a.lower())#
大寫換成小寫
b=a.split()
(b)c={}
for i in b:#
將鍵和對應的值輸入字典
d=0for j in
b:
if i==j:
d=d+1c[i]=d
for i in
c:
print(i,':'
,c[i])
()print()#
去除介詞、冠詞等
jie1=
jie2=set(c)
jie=jie2-jie1
(jie)
for i in
jie:
print(i,":"
,c[i])#排序
f=sorted(c.items(), key=lambda e:e[1], reverse=true)#
將字典c轉換為有序的列表f
(f)j ={}
for item in f:#
將列表f轉換為字典j
j[item[0]] = item[1]
for i in
j:
print(i,':'
,j[i])
#輸出詞頻最大top20
jishu=0
print("
詞頻最大top20:")
for i in
j:
if jishu==20:
break
else
:
print(i,':'
,j[i])
jishu=jishu+1
綜合練習 詞頻統計
綜合練習 詞頻統計預處理 將所有,等分隔符全部替換為空格 將所有大寫轉換為小寫 生成單詞列表 生成詞頻統計 排序排除語法型詞彙,代詞 冠詞 連詞 輸出詞頻最大top20 將分析物件存為utf 8編碼的檔案,通過檔案讀取的方式獲得詞頻分析內容。從記事本長讀取檔案 f open news.txt r e...
綜合練習 詞頻統計
world f.read f.close xiaoqu depart for c in depart world world.replace c,wordlist world.lower split worddict wordset set wordlist xiaoqu for a in word...
綜合練習 詞頻統計
song twinkle,twinkle,little star,how i wonder what you are.up above the world so high,like a diamond in the sky.twinkle,twinkle,little star,how i wond...