學習內容
資料處理
讀取資料
import pandas as pd
data_url =
""#python填寫路徑時,要麼使用/,要麼使用\\
df = pd.read_csv(data_url)
df.head(
)# 讀取資料前5行
print df.tail(
)# 列印資料後5行
print df.columns #列印列名
print df.index #列印行名
df.iloc[[1
,3,5
],[2
,4]]
# 提取不連續行和列的資料,提取的是第1,3,5行,第2,4列的資料
df.iloc[2:
4]#選取第2到第3行
df.iat[3,
2]#專門提取某乙個資料,這個例子提取的是第三行,第二列資料(預設從0開始算)
df.iloc[0,
1]#選取第0行1列的元素
print df.shape #列印維度
123
4567
891011
12
axis=0 axis=1的理解
1表示橫軸,方向從左到右;0表示縱軸,方向從上到;
當axis=1時,陣列的變化是橫向的,而體現出來的是列的增加或者減少;
捨棄資料
print df.drop(df.columns[1,
2], axis =1)
#捨棄資料前兩列
print df.drop(df.columns[[1
,2]]
, axis =0)
#捨棄資料前兩行
1
2增加列
df [『row』] = 1 #需要賦值,且每次只能增加一列
1條件篩選
df[
(df[
'weight'
]<=70)
|(df[
'weight'
]>=
100)
]df[
['day'
,'time']]
[(df.tip>7)
|(df.total_bill>50)
]# 假如加入了篩選條件後,我們只關心day和time
1
2統計描述
print df.describe() # 描述性統計,只篩選出具有描述性的統計資料
df.info() # info()函式用於列印dataframe的簡要摘要,顯示有關dataframe的資訊,包括索引的資料型別dtype和列的資料型別dtype,非空值的數量和記憶體使用情況12
資料處理
df.t # 資料轉置
df.sort_values(by=
'tip'
)#按tip列公升序排序
Python學習手札(十)寶可夢資料分析
然後import我們最常用的三大件 pandas,seaborn,matplotlib,並且讀取資料 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df pd.read csv pokemon da...
python資料分析學習路線
python是一種物件導向 直譯式計算機程式語言,由guido van rossum於1989年底發明。由於他簡單 易學 免費開源 可移植性 可擴充套件性等特點,python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,python受歡迎程度扶搖直上。用python玩轉資料 由於pytho...
Python資料分析 Pandas學習
dataframe是乙個類似於 的資料型別,如圖 data 方框內的資料 numpy ndarray structured or homogeneous dict,or dataframe index 行索引索引 index or array like columns 列索引 index or ar...