euro2012_stats.csv
1.將資料集命名為euro12
import pandas as pd
import numpy as np
path = './data/euro2012.csv'
# 將資料集命名為euro12
euro12 = pd.read_csv(path)
2.只選取 goals 這一列]
# 只選取 goals 這一列
euro12['goals'].head()
3.有多少球隊參與了2012歐洲盃?
# 有多少球隊參與了2012歐洲盃?
len(np.unique(euro12['team']))
4.該資料集中一共有多少列(columns)?
# 該資料集中一共有多少列(columns)?
len(euro12.columns)
5.將資料集中的列team, yellow cards和red cards單獨存為乙個名叫discipline的資料框
# 將資料集中的列team, yellow cards和red cards單獨存為乙個名叫discipline的資料框
discipline = euro12[['team', 'yellow cards', 'red cards']]
discipline.head()
6.對資料框discipline按照先red cards再yellow cards進行排序
# 對資料框discipline按照先red cards再yellow cards進行排序
discipline.sort_values(['red cards', 'yellow cards'], ascending=false)
7.計算每個球隊拿到的黃牌數的平均值
# 計算每個球隊拿到的黃牌數的平均值
euro12['yellow cards'].mean()
8.找到進球數goals超過6的球隊資料
# 找到進球數goals超過6的球隊資料
euro12[euro12['goals']>6]
9.選取以字母g開頭的球隊資料
# 選取以字母g開頭的球隊資料
euro12[euro12['team'].str.startswith('g')]
10.選取前7列
# 選取前7列
euro12.iloc[:,:7]
11.選取除了最後3列之外的全部列
# 選取除了最後3列之外的全部列
euro12.iloc[:,:-3]
12.找到英格蘭(england)、義大利(italy)和俄羅斯(russia)的射正率(shooting accuracy)
# 找到英格蘭(england)、義大利(italy)和俄羅斯(russia)的射正率(shooting accuracy)
country = euro12['team'].isin(['england', 'italy', 'russia'])
euro12[country][['team', 'shooting accuracy']]
pandas 一 資料過濾與排序
import pandas as pd 在df中取某列,比如name df.name df name 取多列 df name age 計數df.name.count 檢視df資訊,info df.info 檢視有多少列 df.shape 1 檢視多少行 df.shape 0 排序,以values排序...
pl sql 過濾,排序,帥選資料小練習02
1.查詢工資大於12000的員工的姓名和工資 select last name,salary from employees where salary 12000 2,查詢員工工號為176的員工的姓名和部門 select last name,department id from employees w...
02 Pandas 資料結構
pandas 處理以下三個資料結構 這些資料結構構建在 numpy 陣列之上,這意味著它們很快。考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。例如,dataframe是series的容器,panel是dataframe的容器。資料結構 維數描述系列1 1d 標記均勻陣列,大小...