復合資料型別，英文詞頻統計

1.列表，元組，字典，集合分別如何增刪改查及遍歷。

列表-list

增list.insert(index, obj)

增加元素到指定位置

index:索引位置

obj：內容

list.extend(list_i)

將list_i列表中的元素增加到list中

刪list.pop():

預設刪除list末尾的元素

list.pop(index)

刪除指定位置的元素,index是索引

del list[index]

刪除指定位置的元素，index是索引

del list

刪除整個列表

list.remove(obj)

移除列表第乙個與obj相等的元素

list.clear()

清空列表全部內容

改list[index]=obj

修改指定位置的元素

查list[index]

通過下標索引，從0開始

list[a:b]

切片,顧頭不顧尾

元組-tup

增tup=tup1+tup2

元組不支援修改，但可以通過連線組合的方式進行增加

刪del tup

元組不支援單個元素刪除，但可以刪除整個元組

改tup=tup[index1],tup1[index2], ...

tup=tup[index1:index2]

元組是不可變型別，不能修改元組的元素。可通過現有的字串拼接構造乙個新元組

tup[index]

通過下標索引，從0開始

查tup[a:b]

切片,顧頭不顧尾

字典-dict

增dict[key]=value

通過賦值的方法增加元素

dict.update(dict_i)

把新的字典dict_i的鍵/值對更新到dict裡(適用dict_i中包含與dict不同的key)

刪del dict[key]

刪除單一元素，通過key來指定刪除

del dict

刪除字典

dict.pop(key)

刪除單一元素，通過key來指定刪除

dict.clear()

清空全部內容

改dict[key]=value

通過對已有的key重新賦值的方法修改

dict.update(dict_i)

把字典dict_i的鍵/值對更新到dict裡(適用dict_i中包含與dict相同的key)

查dict[key]

通過key訪問value值

dict.items()

以列表返回可遍歷的(鍵, 值) 元組陣列

dict.keys()

以列表返回乙個字典所有鍵值

dict.values()

以列表返回乙個字典所有值

dict.get(key)

返回指定key的對應字典值，沒有返回none

集合-set

增

set.add(elmnt)

給集合新增元素，如果新增的元素在集合中已存在，則不執行任何操作。

刪

set.clear()
移除集合中的所有元素。

set.difference_update(set)

移除兩個集合中都存在的元素。用於計算差集的集合。

set.discard(value)
移除指定的集合元素。

set.pop()
隨機移除乙個元素。

set.remove(item)
移除集合中的指定元素。

改

set.update(set)

修改當前集合，可以新增新的元素或集合到當前集合中，如果新增的元素在集合中已存在，

則該元素只會出現一次，重複的會忽略。

查

set.union(set1,set2...)

返回兩個集合的並集，即包含了所有集合的元素，重複的元素只會出現一次。

括號：列表用「」，元組用「（）」，字典和集合用「{}」；

有序無序：

列表和元組有序，字典和集合無序；

可變不可變：

列表、字典和集合可變，元組不可變；

重複不可重複：

列表和元組可重複，字典鍵不可重複，值可以重複，集合不可重複;

儲存與查詢方式：

列表以值的方式儲存為值，可通過索引查詢；

元組以值的方式儲存為值，可通過索引查詢；

字典以鍵值對的方式儲存為值，一般通過鍵查詢；

集合以值的方式儲存為值，可以通過set()來將序列和字典轉換為集合。

3.詞頻統計

2.通過檔案讀取字串str

3.對文字進行預處理

4.分解提取單詞list

5.單詞計數字典set,dict

6.按詞頻排序list.sort(key=lambda),turple

7.排除語法型詞彙，代詞、冠詞、連詞等無語義詞

8.輸出top(20)

排序好的單詞列表word儲存成csv檔案

import pandas as pd
pd.dataframe(data=word).to_csv('big.csv',encoding='utf-8')
線上工具生成詞云：

import
string
import
pandas as pd
defgetnumber(x):
y=x[1]
return
yfile = open('
2.txt
','r
',encoding='
utf-8
').read().lower()
s = "'"
for i in
s:    file = file.replace(s,'')
song =file.split()
exclude = 
cun = set(song)-exclude
dis ={}
for i in
cun:
dis[i] =song.count(i)
words =list(dis.items())
words.sort(key=getnumber,reverse=true)
#輸出前20
for j in range(20):
print
(words[j])
#儲存為csv檔案
				復合資料型別，英文詞頻統計
1.列表，元組，字典，集合分別如何增刪改查及遍歷。列表 list1 a b c d 設定列表1 print list1 輸出列表1 增list1.insert 4,e 增添元素 print list1 刪list1.pop 3 刪除指定位置元素 print list1 改list1 0 q 直接修改...
				復合資料型別，英文詞頻統計
作業部落格要求 1.列表，元組，字典，集合分別如何增刪改查及遍歷。1 列表 list a b hello 1 第一在列表後方新增資料 第二為在對應的下邊插入資料 list.insert 0,0 print list 通過pop 根據索引刪除並返回被刪除的元素 一般通過for迴圈來遍歷列表，如for ...
				復合資料型別，英文詞頻統計
1.列表，元組，字典，集合分別如何增刪改查及遍歷。列表的增刪改及遍歷 定義列表 list1 list gzcc 列表的增加 list1.extend yes 列表的刪除 list1.pop 4 列表的修改 list1 0 1 將第0個元素修改為 1 列表的查詢 list1.index 1 列表的遍歷...

復合資料型別，英文詞頻統計

復合資料型別，英文詞頻統計

復合資料型別，英文詞頻統計

復合資料型別，英文詞頻統計

相關推薦