1、資料的合併
(1)concat方法:將資料橫向合併在一起
resul_up = text_left_up.join(text_right_up) #將left和right拼接在一起,列拼接
(3)merge方法
df.merge(left, right, how='inner', on=none, left_on=none, right_on=none, left_index=false, right_index=false, sort=false, suffixes=('_x', '_y'), copy=true, indicator=false, validate=none)
left/right:要拼接在一起的dataframe
how:以怎樣的方式進行拼接在一起,有inner、left、right、outer,預設為inner
right_on/left_on:用於左側或右側拼接的列名
left_index/right_index:用於左側或右側拼接的行的索引號
sort:是否進行排序
merge只能用於兩張表的拼接
2、資料聚合與運算(1)groupby()
可以進行資料分組以及分組後的資料運算
df[結果屬性].groupby([df[分類屬性1],df[屬性2]…).mean()(函式名稱)
#計算鐵達尼號男性與女性的平均票價
#計算男女的存活人數
#統計在不同等級的票中的不同年齡的船票花費的平均 值
#得出不同年齡的總的存活人數,然後找出存活人數的 最高的年齡,最後計算存活人數最高的存活率(存活人數/總人數)
#不同年齡的存活人數
survived_age = text['survived'].groupby(text['age']).sum()
survived_age.head()
#找出最大值的年齡段
survived_age[survived_age.values==survived_age.max()]
_sum = text['survived'].sum()
print("sum of person:"+str(_sum))
precetn =survived_age.max()/_sum
print("最大存活率:"+str(precetn))
Datawhale 資料分析打卡1
參加了由datawhale舉辦的小組學習活動,學習內容為資料分析,記錄下第一章的所學內容 在資料處理中,第一步通常都需要匯入資料,並進行對資料的初步預覽 導入庫匯入所需資料庫 import numpy as np import pandas as pd 載入資料pd.read csv filenam...
資料分析 PyDay03
列表 以 包圍的資料的集合,以 分隔,列表中可以包含,任何資料型別也可以包含另乙個列表。列表操作 list.count x 計算x出現的次數 list.extend l 向列表中追加另乙個列表l list.index x 獲得引數x在列表中的位置 list.insert 像列表中插入資料 list....
資料分析 Python學習03
函式 定義語法 def 函式名 引數 功能 1.函式的定義和呼叫 定義 並不會執行裡面的功能 defshow print hello python 呼叫 show hello python 2.函式的文件說明 defshowinfo 函式的功能 print hello python 顯示函式的文件注...