csv
是我接觸的比較早的一種檔案,比較好的是這種檔案既能夠以電子**的形式檢視又能夠以文字的形式檢視。最早接觸是在別人的
perl
指令碼中,或許是為了充分利用
perl
的文字處理能力。不過,日常的生活工作中我用到的比較多的倒還是電子**。
建立乙個電子**如下:
使用mac
中numbers
功能將其匯出為
csv檔案,使用文字檢視檔案內容如下:
greydemac-mini:chapter06 greyzhang$ cat data.csv
index,name,comment,,,,
1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,coment_06,,,,
7,name_07,coment_07,,,,
8,name_08,coment_08,,,,
9,name_09,coment_09,,,,
10,name_10,coment_10,,,,
11,name_11,coment_11,,,,
12,name_12,coment_12,,,,
13,name_13,coment_13,,,,
14,name_14,coment_14,,,,
15,name_15,coment_15,,,,
16,name_16,coment_16,,,,
17,name_17,coment_17,,,,
18,name_18,coment_18,,,,
19,name_19,coment_19,,,,
20,name_20,coment_20,,,,
21,name_21,coment_21,,,, 換用
pandas
嘗試資料檔案讀取如下:
in [
1]:import
pandas
as
pd
in [
2]: ls
data.csv data.numbers
in [
3]:
data = pd.read_csv(
'data.csv')
in [
4]:
data
out[
4]:
index name comment unnamed: 3 unnamed: 4 unnamed: 5 unnamed: 6
0 1 name_01 coment_01 nan nan nan nan
1 2 name_02 coment_02 nan nan nan nan
2 3 name_03 coment_03 nan nan nan nan
3 4 name_04 coment_04 nan nan nan nan
4 5 name_05 coment_05 nan nan nan nan
5 6 name_06 coment_06 nan nan nan nan
6 7 name_07 coment_07 nan nan nan nan
7 8 name_08 coment_08 nan nan nan nan
8 9 name_09 coment_09 nan nan nan nan
9 10 name_10 coment_10 nan nan nan nan
10 11 name_11 coment_11 nan nan nan nan
11 12 name_12 coment_12 nan nan nan nan
12 13 name_13 coment_13 nan nan nan nan
13 14 name_14 coment_14 nan nan nan nan
14 15 name_15 coment_15 nan nan nan nan
15 16 name_16 coment_16 nan nan nan nan
16 17 name_17 coment_17 nan nan nan nan
17 18 name_18 coment_18 nan nan nan nan
18 19 name_19 coment_19 nan nan nan nan
19 20 name_20 coment_20 nan nan nan nan
20 21 name_21 coment_21 nan nan nan nan
檢視讀取出來的結果,看的出結果被處理成了
pandas
的dataframe
格式。
in [
6]: type
(data)
out[
6]:
pandas.core.frame.dataframe
前陣子學習
pandas
的時候這部分功能學的一頭霧水,如今看到這部分真有點束手無策。看來,後面還是得好好學習一下,補一下落下的課程了。
python pandas使用記錄
在使用numpy中array格式的矩陣時,我們通常使用如a 2 4,5 10 獲取陣列中一部分資料,但是dataframe結構的陣列就不能這麼寫,可以使用iloc方法,即index locate,另外有個相似的方法loc,這個方法是通過column名字進行資料定位的 import pandas as...
Python pandas 使用 速查
在注釋中的路徑不能使用 只能用 或者 否則執行的時候還是會報unicode 編譯錯誤 list filter lambda s not s.startswith list0 對 list 進行過濾,返回符合條件的 結果列表 使用 regex 查詢並返回有 orders 的 列表item 返回只有 o...
python pandas基礎使用大全
一 生成資料表 匯入pandas庫 import numpy as np import pandas as pd讀取csv或者excel df pd.read csv a.csv df pd.read csv a.csv header 1 df pd.read csv a.csv 字典轉成dataf...