復合資料型別,英文詞頻統計

2021-09-25 18:16:11 字數 2447 閱讀 7274

1.列表,元組,字典,集合分別如何增刪改查及遍歷。

列表:

list1 = ["a", "b", "c", "d"]; #設定列表1

print(list1); #輸出列表1

#增list1.insert(4,'e'); #增添元素

print(list1);

#刪list1.pop(3) #刪除指定位置元素

print(list1);

#改list1[0] = 'q' #直接修改位置元素

print(list1)

#查x = list1.index('c'); #從列表中找出某個值的索引位置

print(x);

#遍歷列表中的每乙個元素

for i in list1: print(i)

元組:num1 = ('a', 'b','c', 'd'); #設定元組

num2 = ('e', 1,'g')

num3=num1+num2 #元組不支援修改,但可以通過連線組合的方式進行增加

print(num3)

#查print (num1[0] ,num2[0])

字典:

num =    #定義字典

#增num['d'] = 4 # 新增資訊

print(num)

#刪del num['d'] # 刪除鍵 d'

print(num)

#改num['a'] = '0'; # 更新a

print(num)

#查print(num['a'])

集合:

set= #定義乙個集合

#增set.add(4)

print(set)

#刪set.remove(4)

print(set)

#集合不能進行修改和查詢

#遍歷for x in set:

print(x)

列表元組

字典集合括號 

() {} 

set() 

有序無序

有序有序

無序 無序

可變不可變

可變不可變 

可變 不可變 

重複不重複 是是

否是儲存方式 

3.詞頻統計

2.通過檔案讀取字串str

3.對文字進行預處理

4.分解提取單詞list

5.單詞計數字典set,dict

6.按詞頻排序list.sort(key=lambda),turple

7.排除語法型詞彙,代詞、冠詞、連詞等無語義詞

8.輸出top(20)

exclude=  #定義停用詞#

#讀取a.txt內容#

def gettxt():

sep=".,:;?!-_'」"

txt=open('a.txt','r').read().lower()

for ch in sep :

txt=txt.replace(ch,' ')

return txt

#獲取單詞#

biglist=gettxt().split()

print(biglist);

print('big:',biglist.count('big'))

bigset=set(biglist)

#過濾單詞,包括一些冠詞和連詞等#

bigset=bigset-exclude

print(bigset)

#單詞計數#

bigdict={}

for word in bigset:

bigdict[word]=biglist.count(word)

print(bigdict)

print(bigdict.items())

word=list(bigdict.items())

#按詞頻排序#

word.sort(key=lambda x:x[1],reverse=true)

print(word)

#輸出頻率較高的詞語top20#

for i in range(20):

print(word[i])

結果:

復合資料型別,英文詞頻統計

作業部落格要求 1.列表,元組,字典,集合分別如何增刪改查及遍歷。1 列表 list a b hello 1 第一在列表後方新增資料 第二為在對應的下邊插入資料 list.insert 0,0 print list 通過pop 根據索引刪除並返回被刪除的元素 一般通過for迴圈來遍歷列表,如for ...

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表的增刪改及遍歷 定義列表 list1 list gzcc 列表的增加 list1.extend yes 列表的刪除 list1.pop 4 列表的修改 list1 0 1 將第0個元素修改為 1 列表的查詢 list1.index 1 列表的遍歷...

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表 list 增list.insert index,obj 增加元素到指定位置 index 索引位置 obj 內容 list.extend list i 將list i列表中的元素增加到list中 刪list.pop 預設刪除list末尾的元素 l...