07 11 Excel與csv等資料的讀取與儲存

2021-10-08 02:20:15 字數 2391 閱讀 7384

1.pandas內建了十多中資料來源讀取函式,常見的就是excel和csv

2、pandas讀取出來的資料都是資料框格式(---dataframe結構),方便後續的資料處理和分析

3.可以快速的將資料儲存為csv或excel格式

4.引數較多,可以自行控制,但多數時候使用預設引數

5.讀取csv時注意編碼,常用的編碼有utf-8,gbk,gbk2312等

6.讀取格式:

df=pd.read.csv('meal_order_info.csv',encoding='gbk')

df=pd.read..csv('meal_ordder_info.csv',encoding='gbk',nrows=10)

具體如下:

os對檔案操作的模組

import os

import pandas as pd

os.getcwd() ---獲得當前(python)所在的路徑

#一般這個路徑比較長,可以將其進行改路名,重新命名為簡短的路經

os.chdir('c:\\data\第三章') #引數為目標簡短路徑

#讀取資料(改路徑之前)

_order_info.csv',encoding='gbk')

#修改路徑後讀取資料

df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',encoding='gbk')

等價於 df=pd.read.csv(r'meal_order_info...csv',encoding='gbk')

#修改路徑目的就是為了將讀取的後的資料儲存至目標路徑

df.head(5) 檢視前五行

df.tail(5) 檢視最後五行

df.dtypes---返回每一列的變數型別

df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',

encoding='gbk',dtype=['info_id':str,'emp_id':str])

#dtype=['info_id':str,'emp_id':str]

將指定變數讀成 指定資料型別 (比如將不可變的id的元int型讀成str,防止修改)

pd.__version__ 檢視pd版本

df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',

encoding='gbk',dtype=['info_id':str,'emp_id':str],nrows=10)

#只讀取前十行

pandas讀取資料時,預設把第一行做表頭

df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',

encoding='gbk',dtype=

,na_values=1501,header=0

)na_values=1501 (資料**現nan,是空值)

hearer=0 ,將第一行做表頭

(基本和讀取csv一致,單excel需要指定sheet_name(工作簿)

df2=pd.read.excel(r'meal_order_detail.xlsx',encoding='utf-8',sheet_name='meal_order_detail1',detype=

)#假定excel有三個工作簿,而且三個鐘的資料都需要讀取

sheet_name=['meal_order_detail'+str(i) for i in range(1,4)]

#sheet_name也可以指定給定sheet_name1、sheet_name2

#若資料中中文太多,建議使用編碼方式:;gbk

for i in sheet_name:

data=pd.read.excel('meal_order_detail.xlsx',encoding='gbk',sheet_name=i,dtype=

) #y因為sheet_name有三個,三次讀取的資料有三部分,三部分資料的合併

data_all=pd.concat

([data_all,data],axis=0,ignore_index=true)

data_all #合併後的三個工作頁的內容

os.getcwd

() --

data_all.to_csv

('data_all.csv',index=false,encoding='gbk'

)

#預設儲存在當前路徑下,即(此時的當前路徑是python所在的路徑)

index=false--是指儲存資料時將已讀取到的資料中的 索引列 shenglve不儲存

等保1 0與等保2 0的區別

等保1.0與等保2.0的區別 等保2.0於2019.12.1日起正式實施,與等保1.0的相差甚大,下面將從幾個方面對二者的區別進行介紹。標準名稱變化 gb t 22239 2008 資訊保安技術 資訊系統安全等級保護基本要求 改為 gb t 22239 2019 資訊保安技術 網路安全等級保護基本要...

等保1 0與等保2 0的區別

等保2.0於2019.12.1日起正式實施,與等保1.0的相差甚大,下面將從幾個方面對二者的區別進行介紹。gb t 22239 2008 資訊保安技術 資訊系統安全等級保護基本要求 改為 gb t 22239 2019 資訊保安技術 網路安全等級保護基本要求 gb t 25070 2019 資訊保安...

Java POI匯入Excel資料預覽與儲存

本文需要使用到5個jar包分別是 poi 3.8 20120326.jar poi ooxml 3.8 20120326.jar poi ooxml schemas 3.8 20120326.jar dom4j 1.6.1.jar xmlbeans 2.3.0.jar。書寫方法inputtingex...