目錄
一、numpy和pandas的不同
二、pandas序列操作
# 二、pandas序列
import pandas as pd
import numpy as np
# 1.生成乙個簡單的一維陣列
# 下面的語句可以理解為新建了乙個一維陣列,但是每行都有乙個標號
s = pd.series([1,3,6,np.nan,44,1])
print(s)
# 2.生成乙個具有行標號和縱標號的二維矩陣
# 生成乙個用於行的索引序列
dates = pd.date_range('20210125', periods=6)
print(dates)
# dataframe是乙個matrix,可以理解為二維的numpy
# ① np.random.randn(6,4)是data,使用numpy隨機數生成
# ② index = dates,定義行索引
# ③ columns = ,定義列索引
df = pd.dataframe(np.random.randn(6,4), index=dates, columns=['a','b','c','d'])
print(df)
# 預設二維矩陣的標號是什麼樣的:使用0,1,2,3,..去表示
df1 = pd.dataframe(np.arange(12).reshape((3,4)))
print(df1)
# 3.使用字典建立dataframe, 每個字典代表一列,key值表示列名
df2 = pd.dataframe()
print(df2)
# 4.輸出行標號
print(df2.index)
# 5.輸出列標號
print(df2.columns)
# 6.輸出每列的標號及其型別
print(df2.dtypes)
# 7.輸出全部的值
print(df2.values, type(df2.values))
# 8.describe描述,只對數值型別的元素起作用,輸出資料的count、mean、std、min、25%、50%、75%、max
print(df2.describe())
# 9.轉置
print(df2.t)
# 10.標號名排序,sort_index,根據標號的名字去排序,axis = 1表示列,axis = 0表示行,ascending表示是否公升序
print(df2.sort_index(axis = 1, ascending=false))
print(df2.sort_index(axis = 0, ascending=false))
# 11.根據列值排序,sort_values,根據值排序,by列標號名
print(df2.sort_values(by='e'))
Pandas 基本介紹
本文是pandas的基本介紹 若用 python 的列表和字典來作比較,那麼可以說 numpy 是列表形式,而 pandas 就是字典形式。pandas是基於numpy構建的,讓numpy為中心的應用變得更加簡單。要使用pandas,首先要了解他主要兩個資料結構 series和dataframe。s...
Pandas基本操作
常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複,保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...
pandas基本操作
pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...