pandas可以訪問多種介質型別資料,例如:記憶體、文字、csv、json、html、excel、hdf5、sql等
生成資料
import numpy as np
import pandas as pd
df = pd.dataframe(np.random.randn(1000, 4), columns = ['a', 'b', 'c', 'd'])
df.head()
ab
cd0-0.132774
-2.420509
0.559352
-0.561248
11.114528
0.253100
-0.677942
0.103792
20.979150
0.377479
0.083386
-0.107285
3-0.176661
0.096700
0.841432
0.124089
41.488258
0.209315
0.602946
0.441837
df02 = pd.date_range()
寫入csv
df.to_csv('foo01.csv')
# 不儲存行索引
df.to_csv('foo02.csv', index=false)
讀取csv
read_csv = pd.read_csv('foo02.csv')
read_csv.head()
ab
cd0-0.132774
-2.420509
0.559352
-0.561248
11.114528
0.253100
-0.677942
0.103792
20.979150
0.377479
0.083386
-0.107285
3-0.176661
0.096700
0.841432
0.124089
41.488258
0.209315
0.602946
0.441837
讀取csv其他引數
pd.read_csv(
'foo02.csv', # 檔名
usecols=[0,1,2,4], # 讀取指定列
nrows=5, # 讀取前幾行
encoding='gbk'
# 編碼,根據文字編碼修改,預設utf-8,可以指定為gbk
)
ab
cd0-0.132774
-2.420509
0.559352
nan1
1.114528
0.253100
-0.677942
nan2
0.979150
0.377479
0.083386
nan3
-0.176661
0.096700
0.841432
nan4
1.488258
0.209315
0.602946
nan
x = pd.read_csv(
'foo02.csv',
parse_dates = , # 將兩列合併解析為時間格式
index_col = 'timestamp'
# 將時間設為行索引
)
寫入hdf5
df.to_hdf('foo.h5', 'df')
從hdf5讀取
pd.read_hdf('foo.h5', 'df')
寫入excel檔案
df.to_excel('foo.xlsx', sheet_name='sheet1')
從excel檔案讀取
pd.read_excel('foo.xlsx', 'sheet1', index_col=none, na_values=['na'])
Python之pandas資料載入 儲存
0.輸入與輸出大致可分為三類 0.1 讀取文字檔案和其他更好效的磁碟儲存格式 2.2 使用資料庫中的資料 0.3 利用web api操作網路資源1.讀取文字檔案和其他更好效的磁碟儲存格式pandas提供了一些用於將 型資料讀取為dataframe物件的函式。1.1 pandas中的解析函式 read...
Pandas 資料的讀取,儲存
pandas 如果沒有匯入,匯出的操作,那所有的一切資料處理的操作都將毫無意義。將 資料讀取為dataframe物件的方法,主要有倆個函式,倆者並無不同,以我看,要是讀取以.csv字尾的檔案,就用第乙個。pd.read csv pd.read table 倆個函式引數設定 sep 拆分資料的字串行,...
Python之pandas資料載入 儲存
0.輸入與輸出大致可分為三類 0.1 讀取文字檔案和其他更好效的磁碟儲存格式 2.2 使用資料庫中的資料 0.3 利用web api操作網路資源1.讀取文字檔案和其他更好效的磁碟儲存格式pandas提供了一些用於將 型資料讀取為dataframe物件的函式。1.1 pandas中的解析函式 read...