"""#pandas 基於numpy,更強大,可以處理有標籤的資料
#serise 帶標籤的一維陣列
import pandas as pd
a = pd.series([1,2,3,4,5])#pd.serise(資料,標籤,型別)
print(a)
b = pd.series([1,2,3,4,5],['a','b','c','d','e'])
print(b)
dic =
c = pd.series(dic)#傳入字典
print(c)
d = pd.series(dic,index=['name','color'])
print(d)
e = pd.series(5,[1,2,3])#自動填充資料
print(e)
#serise只有行名,沒有列名,所以是帶標籤的一維陣列,dataframe是帶標籤的二維陣列(有行名又有列名)
import pandas as pd
import numpy as np
a = np.random.randint(0,10,(2,3))
print(a)
b = pd.dataframe(a,index=['a','b'],columns=['x','y','z'])
print(b)
population = #不能直接向dataframe傳字典資料
c = pd.series(population)
print(pd.dataframe(c))
print(pd.dataframe(c,columns=['population']))#手工設定series資料的列名
#字典方式構建dataframe
gdp = population
print(pd.dataframe())
#多個字典的dataframe
print(pd.dataframe())
print(pd.dataframe())#如果資料是特定資料的話,會填充所有的行(china)
a1 = pd.dataframe()
print(a1.values)#values轉化為numpy資料型別
print(a1.index)#返回行名
print(a1.columns)#返回列名
print(a1.shape)#返回維度
print(a1.size)#元素個數
print(a1.dtypes)#返回每一列資料的型別
import tensorflow as tf
import numpy as np
import pandas as pd
population =
gdp =
a = pd.dataframe()
print(a)
#取列print(a['gdp'])
print(a.gdp)
#取行print(a.loc['beijing'])
print()
#取多行
print(a.loc[['beijing','shanghai']])
#取某元素
print(a.loc['beijing','gdp'])
#索引號取行
print('****',a.iloc[0])#取出第0行
print('\n取多行的時候,使用列表傳入\n',a.iloc[[0,2]])
#values 取值方法(values直接把xx程式設計numpy資料)
print('\n',a.values[0][1])
print('\n\n',a.iloc[:2,:])#取前兩行,列都取
print(a.gdp>0) #對某一行進行操作
print(a[a.gdp>0])
print('\n',a.gdp==243251)
#dataframe賦值
a.iloc[0,1]=9999
print(a)
#dataframe 加一列
a['e']=pd.series([1,2,3],index=['beijing','shanghai','guangzhou'])
print(a)
import pandas as pd
import numpy as np
dates = pd.date_range(start='2020-1-1',periods=6)
print(dates)
df = pd.dataframe(np.random.randint(0,10,(6,4)),index=dates,columns=['a','b','c','d'])#內容,index,columns
print(df)
print(df.describe())#檢視和,平均值,最小值,最大值等資訊
print(df.info())
print(df.head(6))#返回前幾個資料
print(df.tail(1))#返回最後幾個資料
print(df.sort_index(axis=0,ascending=false))#false預設從小到大,
print(df.sort_values('b'))#按照某一列資料進行排序
#計算import pandas as pd
import numpy as np
a = pd.dataframe([1,2,3])
print(a-2)#減運算,直接減乙個數字,表示為每個數字都自減1
b = pd.dataframe([1,2,3])
print(a+b)#兩個張量相加
#矩陣相乘
c = pd.dataframe(np.random.randint(0,10,size=(1,3)))
print(c)
print(a@c)#矩陣相乘符號是艾特
d = pd.dataframe(np.random.randint(0,10,size=(3,3)))
e = pd.dataframe(np.random.randint(0,10,size=(2,2)))
print(d+e)#非數+自然數 = 非數
#缺失值處理
import numpy as np
import pandas as pd
a=pd.dataframe(np.random.randint(0,10,(3,3)))
print(a)
a.iloc[:2,2] = np.nan #將指定數字賦值非數
print(a)
#print(a.dropna()) # 把存在非數nan的行給刪除掉
#print(a.dropna(axis=1)) #把存在nan的列給刪除掉
print(a.dropna(axis=1,how='all'))#只有這一列都是nan的時候才刪除掉
print(a.fillna(value=0))#非數替換為0
"""
Pandas 快速入門
pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...
快速入門Pandas
教你十分鐘學會使用pandas。pandas是python資料分析的乙個最重要的工具。一般以pd作為pandas的縮寫 import pandas as pd 讀取檔案 df pd.read csv file.csv 返回資料的大小 df.shape 顯示資料的一些物件資訊和記憶體使用 df.inf...
pandas 最全入門學習筆記
方法 讀取csv read csv 引 讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...