綜合練習 詞頻統計

2022-08-22 16:51:13 字數 1226 閱讀 3266

import

operator

import

string

f=open("

a.txt

","r")

a=f.read()

a1=f.read()

s=string.punctuation+string.digits

for i in s: #

標點符號換成空格

a=a.replace(i,"")

print

(s)print

(a)print

()print(a.lower())#

大寫換成小寫

b=a.split()

print

(b)c={}

for i in b:#

將鍵和對應的值輸入字典

d=0for j in

b:

if i==j:

d=d+1c[i]=d

for i in

c:

print(i,':'

,c[i])

print

()print

()print()#

去除介詞、冠詞等

jie1=

jie2=set(c)

jie=jie2-jie1

print

(jie)

for i in

jie:

print(i,":"

,c[i])#排序

f=sorted(c.items(), key=lambda e:e[1], reverse=true)#

將字典c轉換為有序的列表f

print

(f)j ={}

for item in f:#

將列表f轉換為字典j

j[item[0]] = item[1]

for i in

j:

print(i,':'

,j[i])

#輸出詞頻最大top20

jishu=0

print("

詞頻最大top20:")

for i in

j:

if jishu==20:

break

else

:

print(i,':'

,j[i])

jishu=jishu+1

綜合練習 詞頻統計

綜合練習 詞頻統計預處理 將所有,等分隔符全部替換為空格 將所有大寫轉換為小寫 生成單詞列表 生成詞頻統計 排序排除語法型詞彙,代詞 冠詞 連詞 輸出詞頻最大top20 將分析物件存為utf 8編碼的檔案,通過檔案讀取的方式獲得詞頻分析內容。從記事本長讀取檔案 f open news.txt r e...

綜合練習 詞頻統計

world f.read f.close xiaoqu depart for c in depart world world.replace c,wordlist world.lower split worddict wordset set wordlist xiaoqu for a in word...

綜合練習 詞頻統計

song twinkle,twinkle,little star,how i wonder what you are.up above the world so high,like a diamond in the sky.twinkle,twinkle,little star,how i wond...