xlrd
主要用於讀取excel檔案
pip install xlrd
import xlrd
# 開啟excel檔案讀取資料
workbook = xlrd.open_workbook('a.xlsx');
# 列印所有的sheet列出所有的sheet名字
print(workbook.sheet_names())
# 根據sheet索引或者名稱獲取sheet內容
data_sheet = workbook.sheets()[0];
# data_sheet = workbook.sheet_by_index(1)
# data_sheet = workbook.sheet_by_name(u'charts')
# 獲取sheet名稱、行數和列數
print(data_sheet.name,data_sheet.nrows,data_sheet.ncols)
# 獲取整行和整列的值(列表)
rows = data_sheet.row_values(0) #獲取第一行內容
cols = data_sheet.col_values(1) #獲取第二列內容
print(rows)
print(cols)
# 獲取單元格內容的資料型別
# 相當於在乙個二維矩陣中取值
# (row,col)-->(行,列)
cell_a1 = data_sheet.cell(0,0).value # 第一行第一列座標a1的單元格資料
# cell_c1 = data_sheet.cell(0,2).value # 第一行第三列座標c1的單元格資料
# cell_b1 = data_sheet.row(0)[1].value # 第1行第2列
# cell_d2 = data_sheet.col(3)[1].value # 第4列第2行
# 檢查單元格的資料型別
# ctype的取值含義
# ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
print(data_sheet.cell(4,0).ctype)
# 讀取excel中單元格內容為日期的方式
date_value = xlrd.xldate_as_tuple(data_sheet.cell_value(4,0),workbook.datemode)
print(date_value) # -->(2017, 9, 6, 0, 0, 0)
print('%d:%d:%d' %(date_value[3:])) # 列印時間
print('%d/%02d/%02d' %(date_value[0:3])) # 列印日期
用LDA處理文字 Python
一 lda介紹 lda latent dirichlet allocation 是一種文件主題生成模型,也稱為乙個三層貝葉斯概率模型,包含詞 主題和文件三層結構。所謂生成模型,就是說,我們認為一篇文章的每個詞都是通過 以一定概率選擇了某個主題,並從這個主題中以一定概率選擇某個詞語 這樣乙個過程得到。...
用Python處理csv檔案
csv 是 逗號分隔值 的英文縮寫,通常都是純文字檔案。建議使用 wordpad 或是記事本 note 來開啟,再則先另存新檔後用 excel 開啟,也是方法之一。一直以為 csv 是某種 excel 檔案,原來是一種純文字檔案,嘗試用記事本開啟乙個 csv 檔案 果然,在記事本中是以逗號為分隔符,...
用LDA處理文字 Python
一 lda介紹 lda latent dirichlet allocation 是一種文件主題生成模型,也稱為乙個三層貝葉斯概率模型,包含詞 主題和文件三層結構。所謂生成模型,就是說,我們認為一篇文章的每個詞都是通過 以一定概率選擇了某個主題,並從這個主題中以一定概率選擇某個詞語 這樣乙個過程得到。...