復合資料型別,英文詞頻統計

2022-05-28 18:54:09 字數 3002 閱讀 2220

本次作業**於:

1.列表,元組,字典,集合分別如何增刪改查及遍歷。

列表:

list=['

a','

b','

c','

d','

e','

f','

g','a'

]'aa')#

增加元素

del list[3]#

刪除第四個元素

list[4]='

egg'

#更改第五個元素

list.insert(3,'

cat') #

插入列表

list.index('

f')#

查詢元素的位置

list.index['

g'] #

檢視元素50的位置

list.count('

a') #

統計元素個數

for i in list: printf(list[i]) #

遍歷

元組:

元組的操作和列表類似,但是元組不能進行增加和修改刪除元組中的元素
list=('

a','b'

)print(list[0])#

通過元組的下標訪問元素

字典:

d=d['

']=4 #

del d['

'] #

a=d['

'] #

d.clear() #

刪除字典中的所有條目

str(d) #

輸出字典for key in d:printf(d[key]) #遍歷

集合

z=set('z'

)z.add('b

') #

增加元素

z.pop() #

隨機刪除元素

z.remove('

b') #

刪除元素  

集合無序,不能查詢和修改指定的元素

列表(list):列表是一組有序專案的數字結構,列表的專案應該放在方括號[ ]中,列表是可以被改變和可重複的;按照索引的方式查詢通過偏移儲存並且元素可以任意型別存在。

元組(tuple):元組與列表十分相似,可重複也是通過偏移的方式進行儲存,不過元組是不可變的即是你是不能對元組中的元素進行修改,而且用的是();元組的元素是固定的長度、異構,也是任意巢狀。

字典(dict):字典使用的是{},字典是無序的,但是可變可重複;使用鍵-值(key-value)進行儲存,查詢速度快;字典的key是不能變的,list不能作為key,字串、元祖、整數等都可以。

集合(set):無序不可變,使用([ ]),與字典類似,但只包含鍵,而沒有對應的值;元素可以是列表、元組、字典中的任意乙個或多個。

3.詞頻統計

2.通過檔案讀取字串 str

3.對文字進行預處理

4.分解提取單詞 list

5.單詞計數字典 set , dict

6.按詞頻排序 list.sort(key=lambda),turple

7.排除語法型詞彙,代詞、冠詞、連詞等無語義詞

8.輸出top(20)

排序好的單詞列表word儲存成csv檔案

import pandas as pd

pd.dataframe(data=word).to_csv('big.csv',encoding='utf-8')

線上工具生成詞云:

exclude=  #

定義陣列#

#讀取harry potter.txt檔案中的英文內容#

defgettxt():

sep="

.,:;?!-_'

"txt=open('

faded.txt

','r

').read().lower()

for ch in

sep :

txt=txt.replace(ch,'')

return

txt#

分解提取單詞#

biglist=gettxt().split()

print

(biglist);

print('

faded:

',biglist.count('

faded'))

bigset=set(biglist)

#過濾單詞,包括一些冠詞和連詞等#

bigset=bigset-exclude

print

(bigset)

#單詞計數#

bigdict={}

for word in

bigset:

bigdict[word]=biglist.count(word)

print

(bigdict)

print

(bigdict.items())

word=list(bigdict.items())

#按詞頻排序#

word.sort(key=lambda x:x[1],reverse=true)

print

(word)

#輸出頻率較高的詞語top20#

for i in range(20):

print

(word[i])

#排序好的單詞列表word儲存成csv檔案#

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表 list1 a b c d 設定列表1 print list1 輸出列表1 增list1.insert 4,e 增添元素 print list1 刪list1.pop 3 刪除指定位置元素 print list1 改list1 0 q 直接修改...

復合資料型別,英文詞頻統計

作業部落格要求 1.列表,元組,字典,集合分別如何增刪改查及遍歷。1 列表 list a b hello 1 第一在列表後方新增資料 第二為在對應的下邊插入資料 list.insert 0,0 print list 通過pop 根據索引刪除並返回被刪除的元素 一般通過for迴圈來遍歷列表,如for ...

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表的增刪改及遍歷 定義列表 list1 list gzcc 列表的增加 list1.extend yes 列表的刪除 list1.pop 4 列表的修改 list1 0 1 將第0個元素修改為 1 列表的查詢 list1.index 1 列表的遍歷...