****************************************
****************************************
統計 python 列表中每種相同元素出現的次數
一、所需材料
二、操所過程
1. 建立乙個常規多維資料列表,這裡用
泰迪杯資料探勘挑戰賽的資料舉例:
>>> x=[10001, ['奔跑吧', '極限挑戰 第三季', '摔跤吧!爸爸', '摔跤吧!爸爸', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣'], ['無', '無', '尼特什·提瓦瑞', '尼特什·提瓦瑞', '羅永賢', '羅永賢', '羅永賢', '羅永賢', '羅永賢', '羅永賢'], ['無', '無', '阿公尺爾·汗,法緹瑪·薩那·紗卡,桑亞·瑪荷塔,阿帕爾夏克提·庫拉那', '阿公尺爾·汗,法緹瑪·薩那·紗卡,桑亞·瑪荷塔,阿帕爾夏克提·庫拉那', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛'], ['綜藝娛樂', '綜藝娛樂', '家庭影院', '家庭影院', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場'], ['無', '無', '其他', '其他', '港台劇場', '港台劇場', '港台劇場', '港台劇場', '港台劇場', '港台劇場'], ['晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上']]
>>> x[0]
10001
>>> x[1]
['奔跑吧', '極限挑戰 第三季', '摔跤吧!爸爸', '摔跤吧!爸爸', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣', '超時空男臣']
>>> x[2]
['無', '無', '尼特什·提瓦瑞', '尼特什·提瓦瑞', '羅永賢', '羅永賢', '羅永賢', '羅永賢', '羅永賢', '羅永賢']
>>> x[3]
['無', '無', '阿公尺爾·汗,法緹瑪·薩那·紗卡,桑亞·瑪荷塔,阿帕爾夏克提·庫拉那', '阿公尺爾·汗,法緹瑪·薩那·紗卡,桑亞·瑪荷塔,阿帕爾夏克提·庫拉那', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛', '蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛']
>>> x[4]
['綜藝娛樂', '綜藝娛樂', '家庭影院', '家庭影院', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場', '電視劇集場']
>>> x[5]
['無', '無', '其他', '其他', '港台劇場', '港台劇場', '港台劇場', '港台劇場', '港台劇場', '港台劇場']
>>> x[6]
['晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上']
2. 使用標準庫中的「collections」:
import collections
dic = collections.counter(x[3]) # 列表必須是 hashable type
for key in dic:
print(key,dic[key]) # key是元素,dic[key]是元素出現的次數
3. 結果
>>> dic = collections.counter(x[3])
>>> for key in dic:
print(key,dic[key])
無 2阿公尺爾·汗,法緹瑪·薩那·紗卡,桑亞·瑪荷塔,阿帕爾夏克提·庫拉那 2
蕭正楠,曹永廉,林夏薇,田蕊妮,何廣沛 6
Python 列表元素統計
列表元素統計方法 1.使用字典 對列表元素進行一次遍歷,將結果保留在字典中 2.使用集合和內建函式 將列表轉化為集合,得到所有不同元素,對不同元素呼叫 list.count item 以統計次數 第二種方法的簡單應用 coding utf 8 question 有乙個數字列表,找出列表 現次數超過列...
shell如何統計文字中每種字元的出現次數
如題,grep o file sort uniq cgrep file 從名為file的檔案中搜尋匹配 號的的部分,這樣寫相當於執行cat file在終端輸出的內容一樣,加了 o 就相當於每個字元占用一行 o,only matching print only the matched non empt...
查詢統計python列表中的重複元素
如何快速的統計出那些是重複的呢?形如aa 1,2,2,3,2,4 的乙個list,其中有重複元素,由於集合中重複元素無意義,所以 bb list set aa 可很容易得到去除重複的列表 1,2,3,4 若比較aa和bb的長度,很容易發現有重複,但無法指出重複的元素是哪些。那麼用網上乙個比較兩個li...