importnumpy as np
import
pandas as pd
data = np.random.normal(0, 1, (10, 5))
index = ["
**{}
".format(i) for i in range(10)]
date = pd.date_range(start="
20180101
", periods=5, freq="b"
)data_pd = pd.dataframe(data, index, date) #
列:index 行:date 資料:data
print("
------------------顯示生成的資料:index,date,data-------------------")
print(data_pd.head()) #
獲取前5行資料
print("
------------------轉置並獲取前3行資料---------------------------------")
print(data_pd.t.head(3))
print("
------------------顯示後面5行資料-------------------------------------")
(data_pd.tail())
print("
------------------設定索引------------------------------------------")
(data_pd.index)
print("
------------------重設索引-------------------------------------")
print(data_pd.reset_index(drop=false).head())
執行結果:
------------------顯示生成的資料:index,date,data-------------------2018-01-01 2018-01-02 2018-01-03 2018-01-04 2018-01-05**0 -1.506607 0.858618 -1.000629 -0.797692 -0.775486**1 1.029000 0.257812 -0.603442 1.181301 0.831904**2 0.793368 1.294983 0.114872 0.637446 0.929683**3 -0.242412 -0.202032 -1.355949 1.135424 2.406216**4 1.042224 -0.465189 -3.235827 0.438931 0.366087
------------------轉置並獲取前3行資料---------------------------------**0 **1 **2 ... **7 **8 **9
2018-01-01 -1.506607 1.029000 0.793368 ... -0.590076 0.272599 0.294911
2018-01-02 0.858618 0.257812 1.294983 ... 0.860489 -0.155215 -1.366205
2018-01-03 -1.000629 -0.603442 0.114872 ... -0.072485 -0.010132 0.260509[3 rows x 10columns]
------------------顯示後面5行資料-------------------------------------
2018-01-01 2018-01-02 2018-01-03 2018-01-04 2018-01-05**5 -0.916197 0.495509 -0.138883 0.815526 -0.288074**6 -0.145641 -2.434759 -0.484725 0.805658 1.682301**7 -0.590076 0.860489 -0.072485 -1.134887 -0.700504**8 0.272599 -0.155215 -0.010132 2.404830 -1.011119**9 0.294911 -1.366205 0.260509 0.879498 0.619766
------------------設定索引------------------------------------------index([
'**0
', '
**1', '
**2', '
**3', '
**4', '
**5', '
**6', '
**7', '
**8', '
**9'], dtype='
object')
------------------重設索引-------------------------------------index 2018-01-01 00:00:00 ... 2018-01-04 00:00:00 2018-01-05 00:00:000 **0 -1.506607 ... -0.797692 -0.775486
1 **1 1.029000 ... 1.181301 0.831904
2 **2 0.793368 ... 0.637446 0.929683
3 **3 -0.242412 ... 1.135424 2.406216
4 **4 1.042224 ... 0.438931 0.366087[5 rows x 6columns]
Pandas統計分析基礎之DataFrame
3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...
Spark 解析XML檔案到DataFrame
公司遇到一點需求,平時load檔案基本上都是csv格式的檔案,可是就有那麼乙個檔案是xml檔案,這也正常,因為檔案是別的team推過來的,自然要遵循他們的格式,於是就要想辦法解析xml檔案。目標是把xml檔案轉換為dataframe,然後寫到表中。可是spark.reader並沒有讀取xml格式檔案...
Pandas學習筆記 Pandas概覽(一)
pandas是python的核心資料分析支援庫,提供了快速 靈活 明確的資料結構,旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的,大小可變的,二維異構 pandas資料結構就像是低維資...