import pandas as pd
import numpy as ny
trucks = data
('trucks')
print(trucks)
所得如下:
1712
before
back yes daylight
2613
after
back yes daylight
3192
before forward yes daylight
4179
after forward yes daylight
52557
before
back no daylight
62373
after
back no daylight
710749
before forward no daylight
89768
after forward no daylight
9634
before
back yes night, illuminate
10411
after
back yes night, illuminate
1195
before forward yes night, illuminate
1255
after forward yes night, illuminate
13325
before
back no night, illuminate
14283
after
back no night, illuminate
151256
before forward no night, illuminate
16987
after forward no night, illuminate
17345
before
back yes night, dark
18179
after
back yes night, dark
1946
before forward yes night, dark
2039
after forward yes night, dark
21579
before
back no night, dark
22494
after
back no night, dark
231018
before forward no night, dark
24885
after forward no night, dark
3.1提取單列
print(trucks.period[2:5]) #第三到五行
或者print(trucks['period'][2:5]) #[ ]裡面是索引的名稱,字串,要加''
得到:
3
before
4after
5before
name: period, dtype: object
#一維的資料,會自動列印成一列的資料,並在最後標明該列的索引名
3.2提取行、列、單個資料
行、列:
#為適應使用者習慣,iloc左邊右開,自+1;loc是鎖定,不會+1
print(trucks.iloc[2:5, 2:]) #列印3-5行,從第三列開始往後
print(trucks.loc[1]) #列印第一行,一維會自行轉置
得到:
collision parked light wheelers
3forward yes daylight true
4forward yes daylight true
5 back no daylight true
freq 712
period before
collision back
parked yes
light daylight
wheelers true
name: 1, dtype: object
或者使用column
dataframes有乙個變數叫columns,這個是儲存了所有的列索引,如果你要擷取某幾個,只要拿到columns這個陣列就行,擷取裡面的元素
columns = trucks.columns
columns = columns[1:] #擷取第二列之後
print(trucks.loc[2:5, columns])
單個資料:print(trucks.collision[1])
print(trucks.freq[3])
得到:
#collision列第乙個
1923.3增、減、插入行/列
增加:
trucks['wheelers']= true #列索引為「wheelers」,每行的值為true,預設增加在最後一列
刪除:
trucks = trucks.drop(1) #刪除第一行
del trucks['freq'] #刪除列標籤為'freq'的這一列
插入:
series 一維
dataframe 二維
panel 三維
4.1series
data = np.array(['a','b','c','d'])
s = pd.series(data) #索引預設為 0 to len(data)-1
print(s)
得到:0 a
1 b
2 c
3 d
dtype: object
#加上索引
s = pd.series(data,index=[100,101,102,103])
print(s)
得到:100 a
101 b
102 c
103 d
dtype: object
4.2dataframedata = [['alex',10],['bob',12],['clarke',13]]
df = pd.dataframe(data,columns=['name','age'])
print(df)
得到:
name age
0 alex 10
1 bob 12
2 clarke 13
pandas入門學習一
本文是學習 利用python進行資料分析 的部分筆記,在這裡感謝作者。一 匯入pandas from pandas import series,dataframe import pandas as pd二,series的有關介紹 series類似於一維陣列,它由一組資料以及一組與之相關的索引組成。由...
pandas入門學習01
pandas底 層是numpy,pandas的操作 pandas.read csv 目錄檔案 讀取csv格式的檔案 pandas裡面字元型是object,不是string pandas.read csv 目錄檔案 head x 大致顯示內容,x可以指定也可以不指定,如果指定則顯示x行 pandas....
pandas 最全入門學習筆記
方法 讀取csv read csv 引 讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...