02 Pandas 資料結構

2021-10-23 23:25:18 字數 1395 閱讀 4483

pandas 處理以下三個資料結構 -

這些資料結構構建在 numpy 陣列之上,這意味著它們很快。

考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。 例如,dataframeseries的容器,paneldataframe的容器。

資料結構

維數描述系列1

1d 標記均勻陣列,大小不變。

資料幀2

一般2d標記,大小可變的表結構與潛在的異質型別的列。面板3

一般3d標記,大小可變陣列。

構建和處理兩個或更多個維陣列是一項繁瑣的任務,使用者在編寫函式時要考慮資料集的方向。 但是使用 pandas 資料結構,減少了使用者的思考。

例如,使用**資料(dataframe),在語義上更有用於考慮索引(行)和列,而不是軸0和軸1

可變性

所有pandas資料結構是值可變的(可以更改),除了系列都是大小可變的。系列是大小不變的。

注 -dataframe被廣泛使用,是最重要的資料結構之一。面板使用少得多。

系列是具有均勻資料的一維陣列結構。例如,以下系列是整數:10,23,56...的集合。

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-rxdilzgl-1598665906242)(02-pandas 資料結構.assets/493141059_40874.png)]

關鍵點

資料幀( dataframe )是乙個具有異構資料的二維陣列。 例如,

姓名年齡

性別等級

maxsu25男

4.45

katie34女

2.78

vina46女

3.9lia18女

4.6上表表示具有整體績效評級組織的銷售團隊的資料。資料以行和列表示。每列表示乙個屬性,每行代表乙個人。

列的資料型別

上面資料幀中四列的資料型別如下:列型別

姓名字串

年齡整數

性別字串

等級浮點型

關鍵點

面板是具有異構資料的三維資料結構。在圖形表示中很難表示面板。但是乙個面板可以說明為dataframe的容器。

關鍵點

資料分析02 Pandas資料結構

import numpy as np import pandas as pd from pandas import series,dataframe由ndarray建立的是引用,而不是副本。對series元素的改變也會改變原來的ndarray物件中的元素。列表沒有這種情況 建立 1 列表建立 ser...

python資料探勘02 pandas基礎

一.pandas引入 from pandas import series,dataframe import pandas as pd 二.pandas的資料結構 1.series series是一種類似一維陣列的物件,他由一組資料 各種numpy資料型別 以及一組與之相關的資料標籤 即索引 組成。o...

Pandas學習筆記 02 pandas基礎

第二章 pandas基礎 目錄2 基本資料結構 3 常用基本函式 4 視窗物件 read csvread tableread excel 公共引數 header none表示第一行不作為列名 index col表示把某一列或幾列作為索引 usecols表示讀取的列,預設讀取所有的列 parse da...