import pandas as pd
import numpy as np
data = pd.read_csv(
'student.csv'
)data.head(
)
學號姓名
班級年齡
01.0
小明1.0
7.01
2.0小華
1.06.0
23.0
小紅2.0
6.03
4.0小麗
3.08.0
45.0
無名氏2.0
99.0
data = pd.read_csv(
'student.csv'
,header=
none
)data.head(
)
01
230學號
姓名班級年齡1
001小明17
2002小華1
63003小紅26
4004小麗3
8
data = pd.read_excel(
'test.xlsx'
)data.head(
)
學號姓名
班級年齡01
小明171
2小華16
23小紅2
634小麗
38
# 指定分隔符為 ,
data = pd.read_table(
'student.csv'
,sep=
',')
data.head(
)
學號姓名
班級年齡
01.0
小明1.0
7.01
2.0小華
1.06.0
23.0
小紅2.0
6.03
4.0小麗
3.08.0
45.0
無名氏2.0
99.0
data = pd.read_csv(
'student.csv'
,skiprows=[1
,2])
data.head(
)
學號姓名
班級年齡
03.0
小紅2.0
6.01
4.0小麗
3.08.0
25.0
無名氏2.0
99.0
3nan
nannan
nan4
7.0曹操
0.0100.0
data = pd.read_table(
'student.csv'
,sep=
',',na_values=
['null'])
data
學號姓名
班級年齡
01.0
小明1.0
7.01
2.0小華
1.06.0
23.0
小紅2.0
6.03
4.0小麗
3.08.0
45.0
無名氏2.0
99.0
5nan
nannan
nan6
7.0曹操
0.0100.0
#進行顯示設定
pd.options.display.max_rows =
5
#讀取檔案一小部分 例5行
data = pd.read_csv(
'student.csv'
,nrows=5)
data
學號姓名
班級年齡01
小明17...
......
......45
無名氏299
5 rows × 4 columns
#分塊 指定一塊的行數
chunker = pd.read_csv(
'student.csv'
,chunksize=2)
chunker
#讀取塊中的資料
tot = pd.series(
)for piece in chunker:
tot = tot.add(piece[
'姓名'
].value_counts(
),fill_value=0)
tot = tot.sort_values(ascending=
false
)tot
曹操 1.0
...
小麗 1.0
length: 6, dtype: float64
with
open
('student.txt'
,'r'
,encoding=
'utf-8'
)as f:
line = f.readline(
)for i in f:
print
(i)
001,小明,1,7
002,小華,1,6
003,小紅,2,6
004,小麗,3,8
005,無名氏,2,99
,,,007,曹操,0,100
frame = pd.dataframe(
)store = pd.hdfstore(
'data.h5'
)store[
'obj1'
]= frame
store[
'obj1_col'
]= frame[
'a']
store[
'obj1'
]
a0
-0.362267
10.581715
......
98-0.873690
99-0.164074
100 rows × 1 columns
import pymysql
conn = pymysql.connect(host=
'localhost'
,user=
'root'
,password=
'19961021'
,db=
'student'
,charset=
'utf8'
)data_sql=pd.read_sql(
"select * from student"
,conn)
data_sql
學號姓名
年齡班級
0001小明7
11002小紅62
2003小華8
33004小麗105
data
學號姓名
班級年齡01
小明171
2小華16
23小紅2
634小麗
3845
無名氏2
99
data.to_csv(
'student-1.csv'
)
from sqlalchemy import create_engine
engine = create_engine(
"mysql+pymysql://{}:{}@{}/{}?charset={}"
.format
('root'
,'19961021'
,'127.0.0.1:3306'
,'student'
,'utf8mb4'))
con = engine.connect(
)#建立連線
#conns = pymysql.connect(host='localhost',user='root',password='19961021',db='student',charset='utf8')
data.to_sql(
name=
'student-1'
, con=con,
if_exists=
, index=
false
,)
pandas學習筆記(三)
生成乙個以2017 01開始,月為頻率的時間構造器 pd.period 引數 乙個時間戳 freq p pd.period 2017 freq m print p 通過加減整數,將週期整體移動 print p 1 print p 2 輸出 2017 01 2017 02 2016 11 prng p...
pandas基礎學習筆記三
二 groupby函式 三 聚合 過濾和變換 第3章 分組.經過groupby後會生成乙個groupby物件,該物件本身不會返回任何東西,只有當相應的方法被呼叫才會起作用 grouped single df.groupby school 根據某一列分組 grouped single.get grou...
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...