Pandas 常用的資料讀取方法

2021-10-04 01:23:19 字數 1162 閱讀 1619

# 讀取普通分隔資料:read_table

# 可以讀取txt,csv(逗號分隔符的資料)

import os

os.chdir(

'c:/users/public/desktop/'

)data1 = pd.read_table(

'data1.txt'

, delimiter=

',',header =

0, index_col=1)

print

(data1)

# delimiter:用於拆分的字元,也可以用sep:sep = ','

# header:用做列名的序號,預設為0(第一行)

# index_col:指定某列為行索引,否則自動索引0, 1, .....

# read_table主要用於讀取簡單的資料,txt/csv

# 讀取csv資料:read_csv

# 先熟悉一下excel怎麼匯出csv

data2 = pd.read_csv(

'data2.csv'

,engine =

'python'

)print

(data2.head())

# engine:使用的分析引擎。可以選擇c或者是python。c引擎快但是python引擎功能更加完備。

# encoding:指定字符集型別,即編碼,通常指定為'utf-8'

# 大多數情況先將excel匯出csv,再讀取

data3 = pd.read_excel(

'地市級黨委書記資料庫(2000-10).xlsx'

,sheetname=

'中國人民共和國地市級黨委書記資料庫(2000-10)'

,header=0)

print

(data3)

# io :檔案路徑。

# sheetname:返回多表使用sheetname=[0,1],若sheetname=none是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict

# header:指定列名行,預設0,即取第一行

# index_col:指定列為索引列,也可以使用u」strings」

Pandas讀取行列資料最全方法

1 讀取方法有按行 單行,多行連續,多行不連續 按列 單列,多列連續,多列不連續 部分不連續行不連續列 按位置 座標 按字元 索引 按塊 list 函式有 df.iloc df.loc df.iat df.at df.ix 2 轉換為df,賦值columns,index,修改新增資料,取行列索引 d...

pandas讀取資料

導庫 import pandas as pd fpath d 123.csv 讀取資料 book pd.read csv fpath 檢視全部內容 book idusename course01 張三7512 李四8023 王二8334 張華9045 小明7856 小紅7667 小七90 檢視前5行...

Pandas 資料讀取

1.讀取table 讀取普通分隔資料 read table 可以讀取txt,csv import osos.chdir f 首先設定一下讀取的路徑 data1 pd.read table data1.txt delimiter header 0 print data1 data1 pd.read t...