資料分析入門 Task03 資料重構

2021-10-23 17:38:38 字數 4834 閱讀 7455

2.5 換一種角度看資料

複習:在前面我們已經學習了pandas基礎,第二章我們開始進入資料分析的業務部分,在第二章第一節的內容中,我們學習了資料的清洗,這一部分十分重要,只有資料變得相對乾淨,我們之後對資料的分析才可以更有力。而這一節,我們要做的是資料重構,資料重構依舊屬於資料理解(準備)的範圍。

開始之前,匯入numpy、pandas包和資料

# 匯入基本庫

import numpy as np

import pandas as pd

# 載入data檔案中的:train-left-up.csv

df_left_up = pd.read_csv(

'./data/train-left-up.csv'

)

2.4.1 將data資料夾裡面的所有資料都載入,觀察資料的之間的關係
#寫入**

df_left_down = pd.read_csv(

'./data/train-left-down.csv'

)df_right_up = pd.read_csv(

'./data/train-right-up.csv'

)df_right_down = pd.read_csv(

'./data/train-right-down.csv'

)

#寫入**

df_left_up.head(

3)

passengerid

survived

pclass

name01

03braund, mr. owen harris12

11cumings, mrs. john bradley (florence briggs th...23

13heikkinen, miss. laina

df_left_down.head(

3)

passengerid

survived

pclass

name

044002

kvillner, mr. johan henrik johannesson

144112

hart, mrs. benjamin (esther ada bloomfield)

244203

hampe, mr. leon

df_right_up.head(

3)

***age

sibsp

parch

ticket

fare

cabin

embarked

0male

22.0

1.00.0

a/5 21171

7.2500

nans

1female

38.0

1.00.0

pc 17599

71.2833

c85c

2female

26.0

0.00.0

ston/o2. 3101282

7.9250

nans

df_right_down.head(

3)

***age

sibsp

parch

ticket

fare

cabin

embarked

0male

31.000

c.a. 18723

10.50

nans

1female

45.011

f.c.c. 13529

26.25

nans

2male

20.000

345769

9.50

nans

【提示】結合之前我們載入的train.csv資料,大致**一下上面的資料是什麼

2.4.2:使用concat方法:將資料train-left-up.csv和train-right-up.csv橫向合併為一張表,並儲存這張表為result_up

s1 =pd.series([0

,1],index=

['a'

,'b'])

pd.concat(

[s1,s1]

,axis=

1)

a    0

b 1

a 0

b 1

dtype: int64

#寫入**

result_up = pd.concat(

[df_left_up,df_right_up]

,axis=

1)

2.4.3 使用concat方法:將train-left-down和train-right-down橫向合併為一張表,並儲存這張表為result_down。然後將上邊的result_up和result_down縱向合併為result。
#寫入**

result_down = pd.concat(

[df_left_down,df_right_down]

,axis=1)

result = pd.concat(

[result_up,result_down]

)

#寫入**

resul_up = df_left_up.join(df_right_up)

result_down = df_left_down.join(df_right_down)

result.head(

3)

passengerid

survived

pclass

name

***age

sibsp

parch

ticket

fare

cabin

embarked

01.0

0.03.0

braund, mr. owen harris

male

22.0

1.00.0

a/5 21171

7.2500

nans

12.0

1.01.0

cumings, mrs. john bradley (florence briggs th...

female

38.0

1.00.0

pc 17599

71.2833

c85c

23.0

1.03.0

heikkinen, miss. laina

female

26.0

0.00.0

ston/o2. 3101282

7.9250

nans

#寫入**

resul_up = pd.merge(df_left_up,df_right_up,left_index=

true

,right_index=

true

)result_down = pd.merge(df_left_down,df_right_down,left_index=

true

,right_index=

true

)result.head(

3)

passengerid

survived

pclass

name

***age

sibsp

parch

ticket

fare

cabin

embarked

01.0

0.03.0

braund, mr. owen harris

male

22.0

1.00.0

a/5 21171

7.2500

nans

12.0

1.01.0

cumings, mrs. john bradley (florence briggs th...

female

38.0

1.00.0

pc 17599

71.2833

c85c

23.0

1.03.0

heikkinen, miss. laina

female

26.0

0.00.0

ston/o2. 3101282

7.9250

nans

2.4.6 完成的資料儲存為result.csv

#寫入**

result.to_csv(

'result.csv'

)

2.5.1 將我們的資料變為series型別的資料
# 將完整的資料載入出來

text = pd.read_csv(

'result.csv'

)text.head(

)# **寫在這裡

unit_result=text.stack(

).head(20)

unit_result.head(

)

Task03 資料重構

將資料train left up.csv和trainright up.csv橫向合併為一張表,並儲存這張表為result up list up text left up,text right up result up pd.concat list up,axis 1 將train left down...

TASK03 資料型別

實戰演練 總結思考 n input 輸入乙個奇數 if mod n,2 0 disp 輸入數字必須是奇數 else n1 2 n 1 m n 1 2 計算擴充套件零矩陣a的行 列數n1和上 下對角線數m 不包括主對角線 a zeros n1 for i 1 n 設定順序數矩陣v for j 1 n ...

Task03 資料型別

語法知識 3.13 奇數階魔方矩陣的程式設計 魔方矩陣又稱幻方,是有相同的行數和列數,並在每行每列 對角線上的和都相等的矩陣。魔方矩陣中的每個元素不能相同。你能構造任何大小 除了2x2 的魔方矩陣。3.14 資料型別概述 3.15 字元型陣列 字元陣列是指用來存放字元資料的陣列。其定義的一般形式為 ...