2.dataframe操作
3.pandas匯**計和計算
額外說明:series常用屬性和函式彙總1.python title() 方法返回"標題化"的字串,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle())。
2.python str.format()函式,它增強了字串格式化的功能。基本語法是通過 {} 和 : 來代替以前的 % 。
format 函式可以接受不限個引數,位置可以不按順序。
3.python 字典(dictionary) keys() 函式以列表返回乙個字典所有的鍵。
import pandas as pd
建立series
series(data, index=index, name=name)
series建立方式:
pd.series(np.arange(5)
)
np.arange
函式返回乙個有終點和起點的固定步長的排列,如[1,2,3,4,5],起點是1,終點是5,步長為1。
引數個數情況: np.arange()函式分為乙個引數,兩個引數,三個引數三種情況
1)乙個引數時,引數值為終點,起點取預設值0,步長取預設值1。
2)兩個引數時,第乙個引數為起點,第二個引數為終點,步長取預設值1。
3)三個引數時,第乙個引數為起點,第二個引數為終點,第三個引數為步長。其中步長支援小數
參考參考文獻2
import pandas as pd
ser1 = pd.series([10
,20,30
,40,50
], index=
['a'
,'b'
,'c'
,'d'
,'e'])
ser2 = pd.series(
range(5
))x1 = ser1.drop(
'c')
print
('drop刪除後的結果x_1為:\n'
, x1)
print
('drop刪除後源資料:\n'
, ser1)
print
('\n'
)x2 = ser1.drop(
['a'
,'e'])
print
('drop刪除後的結果x_2為:\n'
, x2)
print
('drop刪除後源資料:\n'
, ser1)
print
('\n'
)x3 = ser1.pop(
'c')
print
('pop刪除的x_3為:\n'
, x3)
print
('pop刪除後源資料:\n'
, ser1)
print
('\n'
)x4 = ser2.pop(3)
print
('pop刪除的x_4為:\n'
, x4)
print
('pop刪除後源資料:\n'
, ser2)
drop刪除後的結果x_1為:
a 10
b 20
d 40
e 50
dtype: int64
drop刪除後源資料:
a 10
b 20
c 30
d 40
e 50
dtype: int64
drop刪除後的結果x_2為:
b 20
c 30
d 40
dtype: int64
drop刪除後源資料:
a 10
b 20
c 30
d 40
e 50
dtype: int64
pop刪除的x_3為:
30pop刪除後源資料:
a 10
b 20
d 40
e 50
dtype: int64
pop刪除的x_4為:
3pop刪除後源資料:
使用iloc切片方法注意:loc 更加靈活多變,**可讀性更高,iloc **簡潔,但可讀性不高,建議多使用 loc 方法
插入一列新增一行
刪除行
修改dataframe中的資料
pandas庫是基於numpy,可以用numpy提供的函式對資料進行描述性統計。
describe方法能支援對category型別的資料進行描述性統計
Python資料分析筆記
數值型字元型 資料結構 取值 true 真 false 假 運算規則 與 一假為假,兩真為真 true true true false false false 或 兩假為假,一真為真 true true true false false falsenot 非 非真為假,非假為真 not true n...
Python資料分析與應用學習筆記2
分析特徵間的關係 2.折線圖 分析特徵內部資料分布與分散狀況 2.餅圖 3.箱線圖 第一部分主要作用是構建出一張空白的畫布,並可以選擇是否將整個畫布劃分為多個部分,方便在同一幅圖上繪製多個圖形的情況。最簡單的繪圖可以省略第一部分,而後直接在預設的畫布上進行圖形繪製。plt.figure 建立乙個空白...
Python資料分析筆記(二)
接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...