資料分析打卡03

2021-10-23 17:13:47 字數 2779 閱讀 3168

1、資料的合併

(1)concat方法:將資料橫向合併在一起

resul_up = text_left_up.join(text_right_up)  #將left和right拼接在一起,列拼接

(3)merge方法

df.merge(left, right, how='inner', on=none, left_on=none, right_on=none, left_index=false, right_index=false, sort=false, suffixes=('_x', '_y'), copy=true, indicator=false, validate=none)
left/right:要拼接在一起的dataframe

how:以怎樣的方式進行拼接在一起,有inner、left、right、outer,預設為inner

right_on/left_on:用於左側或右側拼接的列名

left_index/right_index:用於左側或右側拼接的行的索引號

sort:是否進行排序

merge只能用於兩張表的拼接

2、資料聚合與運算(1)groupby()

可以進行資料分組以及分組後的資料運算

df[結果屬性].groupby([df[分類屬性1],df[屬性2]…).mean()(函式名稱)

#計算鐵達尼號男性與女性的平均票價

#計算男女的存活人數

#統計在不同等級的票中的不同年齡的船票花費的平均 值

#得出不同年齡的總的存活人數,然後找出存活人數的 最高的年齡,最後計算存活人數最高的存活率(存活人數/總人數)

#不同年齡的存活人數

survived_age = text['survived'].groupby(text['age']).sum()

survived_age.head()

#找出最大值的年齡段

survived_age[survived_age.values==survived_age.max()]

_sum = text['survived'].sum()

print("sum of person:"+str(_sum))

precetn =survived_age.max()/_sum

print("最大存活率:"+str(precetn))

Datawhale 資料分析打卡1

參加了由datawhale舉辦的小組學習活動,學習內容為資料分析,記錄下第一章的所學內容 在資料處理中,第一步通常都需要匯入資料,並進行對資料的初步預覽 導入庫匯入所需資料庫 import numpy as np import pandas as pd 載入資料pd.read csv filenam...

資料分析 PyDay03

列表 以 包圍的資料的集合,以 分隔,列表中可以包含,任何資料型別也可以包含另乙個列表。列表操作 list.count x 計算x出現的次數 list.extend l 向列表中追加另乙個列表l list.index x 獲得引數x在列表中的位置 list.insert 像列表中插入資料 list....

資料分析 Python學習03

函式 定義語法 def 函式名 引數 功能 1.函式的定義和呼叫 定義 並不會執行裡面的功能 defshow print hello python 呼叫 show hello python 2.函式的文件說明 defshowinfo 函式的功能 print hello python 顯示函式的文件注...