3 匯入匯出資料

2021-09-24 16:33:50 字數 1430 閱讀 4160

import pandas as pd  #資料分析與挖掘庫

'''series #index 預設值為0 1 。。。 #類似於**的行或者列

dataframe 類似於**

'''#以陣列形式建立資料框

a = pd.series([8,9,2,1])

a = pd.series([8,9,2,1],index=['one','two','three','four']) #指定索引

pd.dataframe([[2,3,4,5],[23],[43],[33],columns=)#注意,預設行號列號起始只為0

#字典形式

pd.dataframe() #1有1個數但2有3個

#但為了對齊,系統預設填充為444 )

pd.dataframe({'two':list(str(245)) #等效於上面的

#操作d.head() #調取頭部資料,預設前五行,()內加引數取幾行

d.tail() #尾部

d.describe() #統計資料 其中25% 50% 75% 為分位數

d.t #行列轉置,行變列 列變行

d.shape #獲得行列資訊

d.values #第幾行第幾列

d.sort_values(by='行或列的index值')#排序

#從mysql資料庫中取資料

import pymysql

conn=pymysql.connect(host='',user='root',passwd='root',db='名字')

sql = "select*from 名字" #篩選

k = pd.read_sql(sql,conn)

#匯入csv

pda.read_csv('路徑') #其他形式檔案以此類推

#匯入html中的**

pd.read_html('**')

#匯入txt

pd.read_table('路徑')

#寫出資料

csv.to_csv('路徑', encoding='utf-8', index=false) #不寫出索引列

#讀取指定行和列

data = pd.read_csv(r'c:\users\sxxzc\desktop\test.csv', \

usecols=['id', 'name', \

nrows=2])#讀取id 和name兩列,唯讀前兩行

#分塊兒讀取

data = pd.read_csv(r'c:\users\sxxzc\desktop\test.csv', chunksize=900)

#如4500行的資料,這裡分了5塊兒

#然後再全部讀取

pd.concat(data, ignore_index = true)

匯入匯出資料

從檔案中裝載資料 hive load data local inpath overwrite into table t2 partition province beijing local linux本地的檔案。無local 是hdfs的檔案 注意 從本地檔案系統中將資料匯入到hive表的過程中,其實...

資料匯入匯出

資料匯入匯出是指sql server資料庫系統與外部系統之間進行資料交換的操作。匯入資料是草外部資料來源中查詢或指定資料,並將其插入到sql server的資料表中的過程,也就是說把其他系統的資料引入到sql server的資料庫中 而匯出資料是將sql server資料庫中的資料轉換為使用者指定格...

匯入匯出資料

1.按使用者匯出及匯入 匯出 1.用sys登陸orcl 源資料庫 2.建立邏輯目錄 create directory yandata1 as d test dump d test dump 必須物理存在且空間足夠.3.給scott付給許可權可以讀寫邏輯目錄.grant read,write on d...