Python學習第十彈 資料分析實戰

2021-10-09 12:41:47 字數 1518 閱讀 4300

學習內容

資料處理

讀取資料

import pandas as pd

data_url =

""#python填寫路徑時,要麼使用/,要麼使用\\

df = pd.read_csv(data_url)

df.head(

)# 讀取資料前5行

print df.tail(

)# 列印資料後5行

print df.columns #列印列名

print df.index #列印行名

df.iloc[[1

,3,5

],[2

,4]]

# 提取不連續行和列的資料,提取的是第1,3,5行,第2,4列的資料

df.iloc[2:

4]#選取第2到第3行

df.iat[3,

2]#專門提取某乙個資料,這個例子提取的是第三行,第二列資料(預設從0開始算)

df.iloc[0,

1]#選取第0行1列的元素

print df.shape #列印維度

123

4567

891011

12

axis=0 axis=1的理解

1表示橫軸,方向從左到右;0表示縱軸,方向從上到;

當axis=1時,陣列的變化是橫向的,而體現出來的是列的增加或者減少;

捨棄資料

print df.drop(df.columns[1,

2], axis =1)

#捨棄資料前兩列

print df.drop(df.columns[[1

,2]]

, axis =0)

#捨棄資料前兩行

1

2增加列

df [『row』] = 1 #需要賦值,且每次只能增加一列

1條件篩選

df[

(df[

'weight'

]<=70)

|(df[

'weight'

]>=

100)

]df[

['day'

,'time']]

[(df.tip>7)

|(df.total_bill>50)

]# 假如加入了篩選條件後,我們只關心day和time

1

2統計描述

print df.describe() # 描述性統計,只篩選出具有描述性的統計資料

df.info() # info()函式用於列印dataframe的簡要摘要,顯示有關dataframe的資訊,包括索引的資料型別dtype和列的資料型別dtype,非空值的數量和記憶體使用情況12

資料處理

df.t  #  資料轉置 

df.sort_values(by=

'tip'

)#按tip列公升序排序

Python學習手札(十)寶可夢資料分析

然後import我們最常用的三大件 pandas,seaborn,matplotlib,並且讀取資料 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df pd.read csv pokemon da...

python資料分析學習路線

python是一種物件導向 直譯式計算機程式語言,由guido van rossum於1989年底發明。由於他簡單 易學 免費開源 可移植性 可擴充套件性等特點,python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,python受歡迎程度扶搖直上。用python玩轉資料 由於pytho...

Python資料分析 Pandas學習

dataframe是乙個類似於 的資料型別,如圖 data 方框內的資料 numpy ndarray structured or homogeneous dict,or dataframe index 行索引索引 index or array like columns 列索引 index or ar...