1.pandas內建了十多中資料來源讀取函式,常見的就是excel和csv
2、pandas讀取出來的資料都是資料框格式(---dataframe結構),方便後續的資料處理和分析
3.可以快速的將資料儲存為csv或excel格式
4.引數較多,可以自行控制,但多數時候使用預設引數
5.讀取csv時注意編碼,常用的編碼有utf-8,gbk,gbk2312等
6.讀取格式:
df=pd.read.csv('meal_order_info.csv',encoding='gbk')
df=pd.read..csv('meal_ordder_info.csv',encoding='gbk',nrows=10)
具體如下:
os對檔案操作的模組
import os
import pandas as pd
os.getcwd() ---獲得當前(python)所在的路徑
#一般這個路徑比較長,可以將其進行改路名,重新命名為簡短的路經
os.chdir('c:\\data\第三章') #引數為目標簡短路徑
#讀取資料(改路徑之前)
_order_info.csv',encoding='gbk')
#修改路徑後讀取資料
df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',encoding='gbk')
等價於 df=pd.read.csv(r'meal_order_info...csv',encoding='gbk')
#修改路徑目的就是為了將讀取的後的資料儲存至目標路徑
df.head(5) 檢視前五行
df.tail(5) 檢視最後五行
df.dtypes---返回每一列的變數型別
df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',
encoding='gbk',dtype=['info_id':str,'emp_id':str])
#dtype=['info_id':str,'emp_id':str]
將指定變數讀成 指定資料型別 (比如將不可變的id的元int型讀成str,防止修改)
pd.__version__ 檢視pd版本
df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',
encoding='gbk',dtype=['info_id':str,'emp_id':str],nrows=10)
#只讀取前十行
pandas讀取資料時,預設把第一行做表頭
df=pd.read.csv(r'c:\\data\第三章\meal_order_info...csv',
encoding='gbk',dtype=
,na_values=1501,header=0
)na_values=1501 (資料**現nan,是空值)
hearer=0 ,將第一行做表頭
(基本和讀取csv一致,單excel需要指定sheet_name(工作簿)
df2=pd.read.excel(r'meal_order_detail.xlsx',encoding='utf-8',sheet_name='meal_order_detail1',detype=
)#假定excel有三個工作簿,而且三個鐘的資料都需要讀取
sheet_name=['meal_order_detail'+str(i) for i in range(1,4)]
#sheet_name也可以指定給定sheet_name1、sheet_name2
#若資料中中文太多,建議使用編碼方式:;gbk
for i in sheet_name:
data=pd.read.excel('meal_order_detail.xlsx',encoding='gbk',sheet_name=i,dtype=
) #y因為sheet_name有三個,三次讀取的資料有三部分,三部分資料的合併
data_all=pd.concat
([data_all,data],axis=0,ignore_index=true)
data_all #合併後的三個工作頁的內容
os.getcwd
() --
data_all.to_csv
('data_all.csv',index=false,encoding='gbk'
)
#預設儲存在當前路徑下,即(此時的當前路徑是python所在的路徑)
index=false--是指儲存資料時將已讀取到的資料中的 索引列 shenglve不儲存
等保1 0與等保2 0的區別
等保1.0與等保2.0的區別 等保2.0於2019.12.1日起正式實施,與等保1.0的相差甚大,下面將從幾個方面對二者的區別進行介紹。標準名稱變化 gb t 22239 2008 資訊保安技術 資訊系統安全等級保護基本要求 改為 gb t 22239 2019 資訊保安技術 網路安全等級保護基本要...
等保1 0與等保2 0的區別
等保2.0於2019.12.1日起正式實施,與等保1.0的相差甚大,下面將從幾個方面對二者的區別進行介紹。gb t 22239 2008 資訊保安技術 資訊系統安全等級保護基本要求 改為 gb t 22239 2019 資訊保安技術 網路安全等級保護基本要求 gb t 25070 2019 資訊保安...
Java POI匯入Excel資料預覽與儲存
本文需要使用到5個jar包分別是 poi 3.8 20120326.jar poi ooxml 3.8 20120326.jar poi ooxml schemas 3.8 20120326.jar dom4j 1.6.1.jar xmlbeans 2.3.0.jar。書寫方法inputtingex...