Pandas知識點梳理(一)

2021-09-10 17:52:40 字數 1036 閱讀 6472

一、pandas簡介

pandas 是基於numpy 的乙個資料分析包,該工具是為了解決資料分析任務而建立的。pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。

pandas的資料結構(series及dataframe)

series:一維陣列,與numpy中的一維array類似。二者與python基本的資料結構list也很相近,其區別是:list中的元素可以是不同的資料型別,而array和series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。

dataframe:二維的**型資料結構。可以將dataframe理解為series的容器,分析中常以dataframe為主。

二、series使用

1、匯入

import pandas as pd

2、建立series(會有預設索引)

s=pd.series([1,2,『aa』,『bb』])

s0 1

1 22 aa

3 bb

s.index

rangeindex(start=0, stop=4, step=1)

s.values

array([1, 2, 『aa』, 『bb』], dtype=object)

series區別於列表的是,series 可以自定義索引:

s2 = pd.series([『wangxin』,『man』,24],index=[『name』,『***』,『age』])

s2name wangxin

*** man

age 24

s2.index

index([『name』, 『***』, 『age』], dtype=『object』)

s2.values

array([『wangxin』, 『man』, 24], dtype=object)

s2[『name』]

wangxin

通過字典建立series

s3=pd.series()

Numpy知識點梳理(一)

numpy是使用python進行科學計算的基礎包。它的核心內容 乙個強大的n維陣列物件,支援大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。numpy 最重要的乙個特點是其 n 維陣列物件 ndarray,它是一系列同型別資料的集合,以 0 下標為開始進行集合中元素的索引。ndar...

Linux知識點梳理

使用者名稱 主機名 root hostname 使用者名稱 主機名稱 符號含義 當前使用者屬於root使用者 當前使用者屬於普通使用者 注意 對系統進行配置管理時,如要root使用者 檢視主機名稱 hostname設定主機名稱 hostname hadoop senior.com注意 該方式設定,當...

spring 知識點梳理

1.spring預設所有管理的bean都是單例模式 懶載入,所有的bean都是交給spring容器中的map管理,生命週期與spring相同,如果使用多例模式,bean則是交給記憶體管理,生命週期與spring無關 2.ssm分層 控制層 服務層 資料層 對應的註解分別為 controller se...