import numpy as np
import pandas as pd
test = pd.read_csv(
"../table.csv"
, header=
0, index_col=0)
test
ab
cdgene112
34gene232
14gene333
45通過ndim、shape檢視資料的維度資訊
test.ndim
2
test.shape
(3, 4)
通過index
屬性,檢視資料的行名稱test.index
index(['gene1', 'gene2', 'gene3'], dtype='object')
通過columns
屬性,檢視資料的列名稱test.columns
index(['a', 'b', 'c', 'd'], dtype='object')
通過head
屬性,檢視資料的前幾行
可以指定檢視的行數
test.head(
1)
ab
cdgene112
34通過tail
屬性,檢視資料的後幾行
可以指定檢視的行數
test.tail(
2)
ab
cdgene232
14gene333
45通過t
屬性,實現資料轉置
test.t
gene1
gene2
gene3a1
33b2
23c3
14d4
45通過sort_index
屬性,實現按照行名稱或列名稱進行排序
test.sort_index(axis=
1, ascending=
false
)
dc
bagene143
21gene241
23gene354
33通過sort_values
屬性,實現按照資料值排序
test.sort_values(by=
'c', ascending=
false
, axis=
0)
ab
cdgene333
45gene112
34gene232
14通過describe
屬性,可以對資料直接進行統計分析
test.describe(
)
ab
cdcount
3.000000
3.000000
3.000000
3.000000
mean
2.333333
2.333333
2.666667
4.333333
std1.154701
0.577350
1.527525
0.577350
min1.000000
2.000000
1.000000
4.000000
25%2.000000
2.000000
2.000000
4.000000
50%3.000000
2.000000
3.000000
4.000000
75%3.000000
2.500000
3.500000
4.500000
max3.000000
3.000000
4.000000
5.000000
pandas中dict和dataFrame互轉
pd.dataframe dict a 使用df.to dict 缺省會把key和值分開 引數 dict 預設 list series split records index 如果是list dict 這種巢狀情況轉的df,迴轉需要使用records 拿上面的資料舉例,df b a b c 0 0 ...
pandas的資料結構之DataFrame
dataframe是乙個 型的資料結構,它含有一組有序的列,每列可以是不同資料型別的資料。dataframe既有行索引也有列索引,可以將它看作為乙個由series組成的字典 共用同乙個索引 dataframe中的資料是以乙個或多個二維塊儲存的,而不是列表 字典或別的一維資料結構。a 通過字典建立,字...
pandas中的資料結構 DataFrame
型的資料結構 修改某一行 frame.values 0 d 2 frame name1 pay2 x d 2 y b 6000 z c 9000 修改某一行的值 frame.values 1 1 9000 frame name1 pay2 x d 2 y b 9000 z c 9000 獲取某行資料...