讀取 / 儲存excel表
data = pandas.read_excel(filepath)
...data.to_excel(filepath, index=none)
# index=none表示不將dataframe的行索引存入excel
讀取dataframe某行/列
# 讀取data中行索引為5-6,列索引為1、3、5的資料
# test的行索引與data的行索引是對應的
test = data.iloc[5:7, [1, 3, 5]]
# 順序讀取行
for item in data.iterrows():
item[0] # 行索引
item[1]['colname'] # 訪問該行對應的資料
# 讀取某列
test = data['colname']
查詢dataframe中符合某條件的元素
# 條件:例如,data['colname'] == a
# test為新dataframe
test = data.loc[data['colname'] == a]
# 或者
test = data[data['colname' == a]]
# 確定dataframe中符合某條件的元素的位置
#方法一,利用numpy
# 返回值a為tuple型別,tuple[0]為行索引,tuple[1]為列索引
a = numpy.where(data == a)
# 方法二
# test為行索引
test = data[data['colname' == a]].index.tolist()
將某列強制轉換型別
# 將某列資料型別由數值型別轉換為字串型別
data['colname'] = data['colname'].astype(str)
根據某列進行排序
data = data.sort_values(['colname'], ascending=false)
更新framedata元素值
data['colname'][index] = a # 會出現 settingwithcopywarning
# 解決方案如下
data.loc[data['colname'][index]] = a
data.loc[data.bidder == 'parakeet2004'] = a
settingwithcopywarning解決方案 Python Pandas庫與資料處理
讀取資料import pandas as pd pd.read csv 觀察資料 print dtypes 每列的資料型別 print head n 前n行資料 print tail n 後n行資料 print columns 每一列的名字 print shape 行列數 print loc 0 索...
Python pandas資料處理
pandas模組 更高階的資料分析工具 基於numpy構建 包含series和dataframe兩種資料結構,以及相應方法 呼叫方法 from pandas import series,dataframe import pandas as pd series 又像陣列又像字典 有序通常是同構的 元素...
python pandas庫具體用法
一 學習資料探勘,如果是用python的話,必須掌握好科學計算的相關庫,我先學習了pandas的一些具體操作 encoding utf 8 import numpy as np import os import pylab as pl import pandas as pd from pandas ...