pandas 處理以下三個資料結構 -
這些資料結構構建在 numpy 陣列之上,這意味著它們很快。
考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。 例如,dataframe
是series
的容器,panel
是dataframe
的容器。
資料結構
維數描述系列1
1
d 標記均勻陣列,大小不變。
資料幀2
一般2
d標記,大小可變的表結構與潛在的異質型別的列。面板3
一般3
d標記,大小可變陣列。
構建和處理兩個或更多個維陣列是一項繁瑣的任務,使用者在編寫函式時要考慮資料集的方向。 但是使用 pandas 資料結構,減少了使用者的思考。
例如,使用**資料(dataframe
),在語義上更有用於考慮索引(行)和列,而不是軸0
和軸1
。
可變性
所有pandas資料結構是值可變的(可以更改),除了系列都是大小可變的。系列是大小不變的。
注 -dataframe
被廣泛使用,是最重要的資料結構之一。面板使用少得多。
系列是具有均勻資料的一維陣列結構。例如,以下系列是整數:10
,23
,56
,...
的集合。
[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-rxdilzgl-1598665906242)(02-pandas 資料結構.assets/493141059_40874.png)]
關鍵點
資料幀( dataframe )是乙個具有異構資料的二維陣列。 例如,
姓名年齡
性別等級
maxsu25男
4.45
katie34女
2.78
vina46女
3.9lia18女
4.6上表表示具有整體績效評級組織的銷售團隊的資料。資料以行和列表示。每列表示乙個屬性,每行代表乙個人。
列的資料型別
上面資料幀中四列的資料型別如下:列型別
姓名字串
年齡整數
性別字串
等級浮點型
關鍵點
面板是具有異構資料的三維資料結構。在圖形表示中很難表示面板。但是乙個面板可以說明為dataframe
的容器。
關鍵點
資料分析02 Pandas資料結構
import numpy as np import pandas as pd from pandas import series,dataframe由ndarray建立的是引用,而不是副本。對series元素的改變也會改變原來的ndarray物件中的元素。列表沒有這種情況 建立 1 列表建立 ser...
python資料探勘02 pandas基礎
一.pandas引入 from pandas import series,dataframe import pandas as pd 二.pandas的資料結構 1.series series是一種類似一維陣列的物件,他由一組資料 各種numpy資料型別 以及一組與之相關的資料標籤 即索引 組成。o...
Pandas學習筆記 02 pandas基礎
第二章 pandas基礎 目錄2 基本資料結構 3 常用基本函式 4 視窗物件 read csvread tableread excel 公共引數 header none表示第一行不作為列名 index col表示把某一列或幾列作為索引 usecols表示讀取的列,預設讀取所有的列 parse da...