2.5 換一種角度看資料
複習:在前面我們已經學習了pandas基礎,第二章我們開始進入資料分析的業務部分,在第二章第一節的內容中,我們學習了資料的清洗,這一部分十分重要,只有資料變得相對乾淨,我們之後對資料的分析才可以更有力。而這一節,我們要做的是資料重構,資料重構依舊屬於資料理解(準備)的範圍。
開始之前,匯入numpy、pandas包和資料
# 匯入基本庫
import numpy as np
import pandas as pd
# 載入data檔案中的:train-left-up.csv
df_left_up = pd.read_csv(
'./data/train-left-up.csv'
)
2.4.1 將data資料夾裡面的所有資料都載入,觀察資料的之間的關係#寫入**
df_left_down = pd.read_csv(
'./data/train-left-down.csv'
)df_right_up = pd.read_csv(
'./data/train-right-up.csv'
)df_right_down = pd.read_csv(
'./data/train-right-down.csv'
)
#寫入**
df_left_up.head(
3)
passengerid
survived
pclass
name01
03braund, mr. owen harris12
11cumings, mrs. john bradley (florence briggs th...23
13heikkinen, miss. laina
df_left_down.head(
3)
passengerid
survived
pclass
name
044002
kvillner, mr. johan henrik johannesson
144112
hart, mrs. benjamin (esther ada bloomfield)
244203
hampe, mr. leon
df_right_up.head(
3)
***age
sibsp
parch
ticket
fare
cabin
embarked
0male
22.0
1.00.0
a/5 21171
7.2500
nans
1female
38.0
1.00.0
pc 17599
71.2833
c85c
2female
26.0
0.00.0
ston/o2. 3101282
7.9250
nans
df_right_down.head(
3)
***age
sibsp
parch
ticket
fare
cabin
embarked
0male
31.000
c.a. 18723
10.50
nans
1female
45.011
f.c.c. 13529
26.25
nans
2male
20.000
345769
9.50
nans
【提示】結合之前我們載入的train.csv資料,大致**一下上面的資料是什麼
2.4.2:使用concat方法:將資料train-left-up.csv和train-right-up.csv橫向合併為一張表,並儲存這張表為result_up
s1 =pd.series([0
,1],index=
['a'
,'b'])
pd.concat(
[s1,s1]
,axis=
1)
a 0
b 1
a 0
b 1
dtype: int64
#寫入**
result_up = pd.concat(
[df_left_up,df_right_up]
,axis=
1)
2.4.3 使用concat方法:將train-left-down和train-right-down橫向合併為一張表,並儲存這張表為result_down。然後將上邊的result_up和result_down縱向合併為result。#寫入**
result_down = pd.concat(
[df_left_down,df_right_down]
,axis=1)
result = pd.concat(
[result_up,result_down]
)
#寫入**
resul_up = df_left_up.join(df_right_up)
result_down = df_left_down.join(df_right_down)
result.head(
3)
passengerid
survived
pclass
name
***age
sibsp
parch
ticket
fare
cabin
embarked
01.0
0.03.0
braund, mr. owen harris
male
22.0
1.00.0
a/5 21171
7.2500
nans
12.0
1.01.0
cumings, mrs. john bradley (florence briggs th...
female
38.0
1.00.0
pc 17599
71.2833
c85c
23.0
1.03.0
heikkinen, miss. laina
female
26.0
0.00.0
ston/o2. 3101282
7.9250
nans
#寫入**
resul_up = pd.merge(df_left_up,df_right_up,left_index=
true
,right_index=
true
)result_down = pd.merge(df_left_down,df_right_down,left_index=
true
,right_index=
true
)result.head(
3)
passengerid
survived
pclass
name
***age
sibsp
parch
ticket
fare
cabin
embarked
01.0
0.03.0
braund, mr. owen harris
male
22.0
1.00.0
a/5 21171
7.2500
nans
12.0
1.01.0
cumings, mrs. john bradley (florence briggs th...
female
38.0
1.00.0
pc 17599
71.2833
c85c
23.0
1.03.0
heikkinen, miss. laina
female
26.0
0.00.0
ston/o2. 3101282
7.9250
nans
2.4.6 完成的資料儲存為result.csv
#寫入**
result.to_csv(
'result.csv'
)
2.5.1 將我們的資料變為series型別的資料# 將完整的資料載入出來
text = pd.read_csv(
'result.csv'
)text.head(
)# **寫在這裡
unit_result=text.stack(
).head(20)
unit_result.head(
)
Task03 資料重構
將資料train left up.csv和trainright up.csv橫向合併為一張表,並儲存這張表為result up list up text left up,text right up result up pd.concat list up,axis 1 將train left down...
TASK03 資料型別
實戰演練 總結思考 n input 輸入乙個奇數 if mod n,2 0 disp 輸入數字必須是奇數 else n1 2 n 1 m n 1 2 計算擴充套件零矩陣a的行 列數n1和上 下對角線數m 不包括主對角線 a zeros n1 for i 1 n 設定順序數矩陣v for j 1 n ...
Task03 資料型別
語法知識 3.13 奇數階魔方矩陣的程式設計 魔方矩陣又稱幻方,是有相同的行數和列數,並在每行每列 對角線上的和都相等的矩陣。魔方矩陣中的每個元素不能相同。你能構造任何大小 除了2x2 的魔方矩陣。3.14 資料型別概述 3.15 字元型陣列 字元陣列是指用來存放字元資料的陣列。其定義的一般形式為 ...