復合資料型別,英文詞頻統計

2022-09-10 15:42:31 字數 2120 閱讀 9725

作業要求:

1.列表,元組,字典,集合分別如何增刪改查及遍歷。

列表的增刪改查字典的增刪改查

#增加dict1['key3']='value3' #字典可以自動新增

dict1.setdefault('key5','n/a') #如果不存在,就設定預設值

#刪除del dict1['key3']

print dict1.pop('key2') #popitem隨機刪除 和列表的pop一樣

#dict1.clear() #深刪除,即使有拷貝 也會被刪除

#修改if 'key1' in dict1:

dict1['key1']='new_value_1'

#查詢if 'key1' in dict1:

print dict1['key1']

if dict1.has_key('key1'):

print dict1['key1']

print dict1.get('key3','not exists') #寬鬆訪問

print dict1.keys(),dict1.values()

#遍歷for key in d:printf(d[key])

段落的增刪

a=set('a')

#增加元素

a.add('b')

#刪除元素

a.remove('b') 或者 a.discard('b')  

a.pop() #隨機刪除元素

列表: list是處理一組有序專案的資料結構,即你可以在乙個列表中儲存乙個序列的專案。列表中的專案。列表中的專案應該包括在方括號中,這樣python就知道你是在指明乙個列表。一旦你建立了乙個列表,你就可以新增,刪除,或者是搜尋列表中的專案。由於你可以增加或刪除專案,我們說列表是可變的資料型別,即這種型別是可以被改變的,並且列表是可以巢狀的。

元組:元組和列表十分相似,不過元組是不可變的。即你不能修改元組。元組通過圓括號中用逗號分隔的專案定義。元組通常用在使語句或使用者定義的函式能夠安全的採用一組值的時候,即被使用的元組的值不會改變。元組可以巢狀。

字典: 字典類似於你通過聯絡人名稱查詢位址和聯絡人詳細情況的位址簿,即,我們把鍵(名字)和值(詳細情況)聯絡在一起。注意,鍵必須是唯一的,就像如果有兩個人恰巧同名的話,你無法找到正確的資訊。

鍵值對在字典中以這樣的方式標記:d = 。注意它們的鍵/值對用冒號分割,而各個對用逗號分割,所有這些都包括在花括號中。另外,記住字典中的鍵/值對是沒有順序的。如果你想要乙個特定的順 序,那麼你應該在使用前自己對它們排序。

集合:特性:與字典類似,但只包含鍵,而沒有對應的值,包含的資料不重複。

3.詞頻統計

2.通過檔案讀取字串 str

3.對文字進行預處理

4.分解提取單詞 list

5.單詞計數字典 set , dict

6.按詞頻排序 list.sort(key=lambda),turple

7.排除語法型詞彙,代詞、冠詞、連詞等無語義詞

8.輸出top(20)

9.視覺化:詞云

排序好的單詞列表word儲存成csv檔案

import pandas as pd

pd.dataframe(data=word).to_csv('big.csv',encoding='utf-8')

線上工具生成詞云:

**架構:

前20的單詞:

生成csv格式:

生成詞云:

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表 list1 a b c d 設定列表1 print list1 輸出列表1 增list1.insert 4,e 增添元素 print list1 刪list1.pop 3 刪除指定位置元素 print list1 改list1 0 q 直接修改...

復合資料型別,英文詞頻統計

作業部落格要求 1.列表,元組,字典,集合分別如何增刪改查及遍歷。1 列表 list a b hello 1 第一在列表後方新增資料 第二為在對應的下邊插入資料 list.insert 0,0 print list 通過pop 根據索引刪除並返回被刪除的元素 一般通過for迴圈來遍歷列表,如for ...

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表的增刪改及遍歷 定義列表 list1 list gzcc 列表的增加 list1.extend yes 列表的刪除 list1.pop 4 列表的修改 list1 0 1 將第0個元素修改為 1 列表的查詢 list1.index 1 列表的遍歷...