假設有個excel 2007檔案「電影導演演員.xlsx」,其中有三列分別為電影名稱、導演和演員列表(同乙個電影可能會有多個演員,每個演員姓名之間使用逗號分隔),現在要求統計每個演員的參演電影分別是哪些。
下面的**使用到了擴充套件庫openpyxl來讀取xlsx檔案,需要使用pip進行安裝。
'''根據電影、導演、演員清單,統計每個演員的參演電影'''
import openpyxl
from openpyxl import workbook
def getactors(filename):
actors = dict()
# 開啟xlsx檔案,並獲取第乙個worksheet
wb = openpyxl.load_workbook(filename)
ws = wb.worksheets[0]
# 遍歷excel檔案中的所有行
for index, row in
enumerate(ws.rows):
# 繞過第一行的表頭
if index == 0:
continue
# 獲取電影名稱和演員列表
filmname, actor = row[0].value, row[2].value.split(',')
# 遍歷該電影的所有演員,統計參演電影
for a in actor:
actors[a] = actors.get(a, set())
actors[a].add(filmname)
return actors
actors = getactors('電影導演演員.xlsx')
actors =
sorted
(actors.items(), key=
lambda
x:int
(x[0][2:]))
for item in actors:
print(item)
**執行結果為:
python讀取excel檔案
一 安裝xlrd模組 二 使用介紹 1 匯入模組 import xlrd 2 開啟excel檔案讀取資料 data xlrd.open workbook excelfile.xls 3 使用技巧 獲取乙個工作表 table data.sheets 0 通過索引順序獲取 table data.shee...
python讀取excel檔案
coding utf 8 import xlrd 路徑前加 r,讀取的檔案路徑 file path r f test.xlsx 檔案路徑的中文轉碼 file path file path.decode utf 8 獲取資料 data xlrd.open workbook file path 獲取sh...
python讀取excel檔案
週末師姐讓我幫忙處理一下之前的醫療資料,資料都存放在excel檔案中,需要從裡面提取出部分資料並轉化為她指定的格式。總共有20幾個檔案,如果手動處理的話,不僅效率低下而且很繁雜,於是我編寫了python指令碼來完成了本次的工作,下面記錄一下相關的知識,並做乙個總結。我用到的庫是 openpyxl 首...