pandas 常用函式總結(待更新)

2021-10-02 02:14:56 字數 1886 閱讀 6119

目錄

1. 將時間字串轉化為時間戳

2. 設定索引列

3. 讀取檔案columns細節處理

3.1 csv預設將第一行設定為columns

3.2 想要換乙個別的列名(原來有)

3.3 想加列名,原來沒有

3.4 不想加列名,原來也沒有

原始資料: 

觀測時間        經度       緯度     強度     陡度

0  2012-02-22 12:14:52.0  118.6845  31.6724  55.66   5.02

1  2012-02-22 12:21:55.0  118.6875  31.7405  72.99  62.28

2  2012-02-22 12:27:46.0  118.6998  31.7565  77.46   8.93

3  2012-02-22 12:35:34.0  118.9438  31.4310 -29.47 -17.97

4  2012-02-22 12:35:34.0  118.9416  31.4422 -13.43  -6.88

**: 

效果:

觀測時間        經度       緯度      強度      陡度

0   1.329884e+09  118.6845  31.6724   55.66    5.02

1   1.329885e+09  118.6875  31.7405   72.99   62.28

2   1.329885e+09  118.6998  31.7565   77.46    8.93

3   1.329885e+09  118.9438  31.4310  -29.47  -17.97

4   1.329885e+09  118.9416  31.4422  -13.43   -6.88 

解釋:

strptime函式是將字串按照後面的格式轉換成時間元組型別;mktime函式則是將時間元組轉換成時間戳。

**: 

data.set_index("觀測時間", inplace=true)
解釋:

將 data["觀測時間"] 作為新的索引。

以 read_csv() 為例

import pandas as pd 

df_example = pd.read_csv('***.csv')

# 等同於:

df_example = pd.read_csv('***.csv', header=0)

df_example = pd.read_csv('***.csv', names=['a', 'b','c']) 

# 即df_example = pd.read_csv('***.csv', header=0, names=['a', 'b','c'])

# header=0 來說明檔案裡原來有列名

df_example = pd.read_csv('***.csv', header=none, names=['a', 'b','c']) 

# header=none 來說明原來是沒有columns的

df_example = pd.read_csv('***.csv', header=none) 

# header=none 來說明原來是沒有columns的

感謝(不斷增加 =,=):

pandas將日期轉換成timestamp

pandas在讀取csv時如何設定列名--常用方法集錦

pandas 常用函式

本文翻譯自文章 pandas cheat sheet python for data science 同時新增了部分註解。對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和...

Pandas常用函式

count 非 na 值的數量 describe 針對 series 或 df 的列計算匯 計 min max 最小值和最大值 argmin argmax 最小值和最大值的索引位置 整數 idxmin idxmax 最小值和最大值的索引值 quantile 樣本分位數 0 到 1 sum求和 mea...

pandas常用函式

pd.read csv filename 從csv檔案匯入資料 pd.read table filename 從限定分隔符的文字檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫...