dataframe建立方法有很多,常用基本格式是:dataframe 構造器引數:dataframe(data=,index=,coloumns=)
in [272]: df2=dataframe(np.arange(16).reshape((4,4)),index=['a','b','c','d'],columns=['one','two','three','four'])
in [273]: df2
out[273]:
one two three four
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15
in [204]: data= #建立不等長字典序列
in [205]: data
out[205]:
in [206]: df=dataframe(data)
traceback (most recent call last):
...valueerror: arrays must all be same length # 報錯,傳入的陣列必須等長
in [207]: data= #建立等長字典序列
in [208]: df=dataframe(data)
in [209]: df
out[209]:
a c # 建立完成後'a','c'自動按照字典序排序,並且建立時自定加上索引
0 5 1
1 6 2
建立完成後'a','c'自動按照字典序排序,並且建立時自定加上索引
如果指定了columns名稱,則會按照指定順序建立。
in [210]: df=dataframe(data,columns=['c','a'])
in [211]: df
out[211]:
c a #按照指定順序建立。
Python pandas,建立Series型別
numpy只能處理數值型別的資料。pandas除了可以處理數值型別外,還可以處理非數值型別的資料 例如 字串 時間序列等 pandas常用的資料型別 series 一維,帶標籤的陣列,對應資料庫中的一條記錄 dataframe 二維,series容器,對應資料庫中的表 demo.py series的...
Python Pandas的apply函式使用示例
資料大致是這個樣子 美國人口普查資料 以每個州人口最多的 3 個縣的人口總和為這個州人口的衡量標準,哪 3 個州人口最多?在 2010 年至 2015 年間人口變化幅度最大的是哪個縣?先按州分組,再對每個州內的縣進行排序選出人口最多的 3 個縣求和,作為每個州的人口數,最後排序。對於每個縣,計算 2...
餃子大人的Python Pandas
我假設你已經有了一定的python基礎,而是在日常的使用中為不知道某個函式的功能而發愁的小夥伴。以下是我總結分享出numpy的一些函式的使用方法。希望能夠幫助到大家。如果您覺得我分享的內容對您有點幫助的話,請點贊收藏吧。肯定有錯,當然不全,但按你胃 anyway 成長的路上就是要不斷的犯錯。部落格中...