Python資料的建立和選擇

2021-10-06 23:47:00 字數 2337 閱讀 8655

這裡是南京財經大學的mooc課程的個人學習筆記,課程**是:課程是免費的,老師講的很好很認真,歡迎學習。

in:

import pandas as pd

data =

d = pd.dataframe(data, index=[2

,1,0

])#指定索引為2 1 0

d為dataframe物件,將基礎資料轉化為dataframe是至關重要的。

思考:

這裡是通過字典型別生成dataframe物件,那麼還可以通過什麼型別生成dataframe物件?

csv to dataframe(csv檔案構建dataframe):df = pd.read_csv('./***.csv')

關於csv建立dataframe的例子,可以參照python資料分析例項-鏈家資料-超詳盡教程

對於上述資料集,如何選擇規定的資料?

這裡介紹按照排列順序的選擇(iloc、直接),和與索引相關的選擇(loc)

選擇某一列:

in:print(d['id'])orprint(d.id)

選擇多列:

in:

print

(d[[

'id'

,'name']]

)# or

print

(d.loc[:,

['id'

,'name']]

)

選擇2-3行in:print(d[1:3])out:

注意:這個地方可以發現,用這個方法選擇的2-3行,並不是索引2-3,而是實際的排序上的第2第3

選擇索引1,2

in:

# in1:

print

(d.loc[[1

,2]]

)# in2:

print

(d.loc[2:

1])# 注意,反過來寫成1:2是不可以的,因為按照資料的順序,索引的排序是2,1,0

區域選擇

in:

s1 =

['name'

,'gender'

]print

(d[s1][1

:3])

# or

print

(d.loc[1:

0,['name'

,'gender']]

)# or

print

(d.loc[[1

,0],

['name'

,'gender']]

)orprint

(d.iloc[1:

3,1:3])

傳入兩個控制變數,順序可以調換,乙個控制行範圍,乙個控制列範圍。

條件選擇

獲取年齡大於23歲的資料

in:

print

(d[d[

'age'

]>23]

)

練習:查詢身高大於1.80的男生姓名in:

import pandas as pd

data =

df = pd.dataframe(data)

# 答案:

print

(df[df[

'height'

]>

1.8]

[df[

'gender']==

true][

'name'

])

python字典的建立和輸出 字典的建立和使用

直接建立 d 輸出結果 dict函式 通過序列對建立字典 vaulues name daniel age 23 1 print dict values 通過關鍵字建立字典 print dict name daniel age 23,1 如果 dict 不傳入任何引數將會返回乙個空字典 print d...

Python 模組的建立和使用

1.模組的建立 模組 module 模組化,模組化指將乙個完整的程式分解為乙個乙個小的模組 通過將模組組合,來搭建出乙個完整的程式 不採用模組化,統一將所有的 編寫到乙個檔案中 採用模組化,將程式分別編寫到多個檔案中 模組化的優點 方便開發 方便維護 模組可以復用!在python中乙個py檔案就是乙...

python列表的建立和刪除

列表 list 是最重要的python內建物件之一,是包含若干元素的有序聯絡記憶體空間在形式上,列表的所有元素放在一對方括號中,相鄰元素之間使用逗號分隔,同一列表元素的資料型別可以各不相同,可以同時包含整數 實數 字串等基本型別的元素,也可以包含列表 元組 字典 集合 函式以及其他任意物件。如果只有...