import pandas as pd #資料分析與挖掘庫
'''series #index 預設值為0 1 。。。 #類似於**的行或者列
dataframe 類似於**
'''#以陣列形式建立資料框
a = pd.series([8,9,2,1])
a = pd.series([8,9,2,1],index=['one','two','three','four']) #指定索引
pd.dataframe([[2,3,4,5],[23],[43],[33],columns=)#注意,預設行號列號起始只為0
#字典形式
pd.dataframe() #1有1個數但2有3個
#但為了對齊,系統預設填充為444 )
pd.dataframe({'two':list(str(245)) #等效於上面的
#操作d.head() #調取頭部資料,預設前五行,()內加引數取幾行
d.tail() #尾部
d.describe() #統計資料 其中25% 50% 75% 為分位數
d.t #行列轉置,行變列 列變行
d.shape #獲得行列資訊
d.values #第幾行第幾列
d.sort_values(by='行或列的index值')#排序
#從mysql資料庫中取資料
import pymysql
conn=pymysql.connect(host='',user='root',passwd='root',db='名字')
sql = "select*from 名字" #篩選
k = pd.read_sql(sql,conn)
#匯入csv
pda.read_csv('路徑') #其他形式檔案以此類推
#匯入html中的**
pd.read_html('**')
#匯入txt
pd.read_table('路徑')
#寫出資料
csv.to_csv('路徑', encoding='utf-8', index=false) #不寫出索引列
#讀取指定行和列
data = pd.read_csv(r'c:\users\sxxzc\desktop\test.csv', \
usecols=['id', 'name', \
nrows=2])#讀取id 和name兩列,唯讀前兩行
#分塊兒讀取
data = pd.read_csv(r'c:\users\sxxzc\desktop\test.csv', chunksize=900)
#如4500行的資料,這裡分了5塊兒
#然後再全部讀取
pd.concat(data, ignore_index = true)
匯入匯出資料
從檔案中裝載資料 hive load data local inpath overwrite into table t2 partition province beijing local linux本地的檔案。無local 是hdfs的檔案 注意 從本地檔案系統中將資料匯入到hive表的過程中,其實...
資料匯入匯出
資料匯入匯出是指sql server資料庫系統與外部系統之間進行資料交換的操作。匯入資料是草外部資料來源中查詢或指定資料,並將其插入到sql server的資料表中的過程,也就是說把其他系統的資料引入到sql server的資料庫中 而匯出資料是將sql server資料庫中的資料轉換為使用者指定格...
匯入匯出資料
1.按使用者匯出及匯入 匯出 1.用sys登陸orcl 源資料庫 2.建立邏輯目錄 create directory yandata1 as d test dump d test dump 必須物理存在且空間足夠.3.給scott付給許可權可以讀寫邏輯目錄.grant read,write on d...