目錄
1. 將時間字串轉化為時間戳
2. 設定索引列
3. 讀取檔案columns細節處理
3.1 csv預設將第一行設定為columns
3.2 想要換乙個別的列名(原來有)
3.3 想加列名,原來沒有
3.4 不想加列名,原來也沒有
原始資料:
觀測時間 經度 緯度 強度 陡度**:0 2012-02-22 12:14:52.0 118.6845 31.6724 55.66 5.02
1 2012-02-22 12:21:55.0 118.6875 31.7405 72.99 62.28
2 2012-02-22 12:27:46.0 118.6998 31.7565 77.46 8.93
3 2012-02-22 12:35:34.0 118.9438 31.4310 -29.47 -17.97
4 2012-02-22 12:35:34.0 118.9416 31.4422 -13.43 -6.88
效果:
觀測時間 經度 緯度 強度 陡度解釋:0 1.329884e+09 118.6845 31.6724 55.66 5.02
1 1.329885e+09 118.6875 31.7405 72.99 62.28
2 1.329885e+09 118.6998 31.7565 77.46 8.93
3 1.329885e+09 118.9438 31.4310 -29.47 -17.97
4 1.329885e+09 118.9416 31.4422 -13.43 -6.88
strptime函式是將字串按照後面的格式轉換成時間元組型別;mktime函式則是將時間元組轉換成時間戳。
**:
data.set_index("觀測時間", inplace=true)
解釋:
將 data["觀測時間"] 作為新的索引。
以 read_csv() 為例
import pandas as pd
df_example = pd.read_csv('***.csv')
# 等同於:
df_example = pd.read_csv('***.csv', header=0)
df_example = pd.read_csv('***.csv', names=['a', 'b','c'])
# 即df_example = pd.read_csv('***.csv', header=0, names=['a', 'b','c'])
# header=0 來說明檔案裡原來有列名
df_example = pd.read_csv('***.csv', header=none, names=['a', 'b','c'])
# header=none 來說明原來是沒有columns的
df_example = pd.read_csv('***.csv', header=none)
# header=none 來說明原來是沒有columns的
感謝(不斷增加 =,=):
pandas將日期轉換成timestamp
pandas在讀取csv時如何設定列名--常用方法集錦
pandas 常用函式
本文翻譯自文章 pandas cheat sheet python for data science 同時新增了部分註解。對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和...
Pandas常用函式
count 非 na 值的數量 describe 針對 series 或 df 的列計算匯 計 min max 最小值和最大值 argmin argmax 最小值和最大值的索引位置 整數 idxmin idxmax 最小值和最大值的索引值 quantile 樣本分位數 0 到 1 sum求和 mea...
pandas常用函式
pd.read csv filename 從csv檔案匯入資料 pd.read table filename 從限定分隔符的文字檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫...