def readfile(file_path):
#定義讀取1024位元組
blocksize=1024
#通過utf8格式 r讀格式
with open(file_path,"r",encoding="utf8) as f:
#迴圈讀出檔案
while true:
block=f.read(blocksize)
if block
yield block
else
return
file_path="./data/1.log"
#處理簡單就是列印處理
for block in readfile(file_path):
print(block)
#todo
一維資料:列表和集合型別
二維資料:列表
高維資料:字典,json,xml和yaml
常用為csv資料儲存格式,csv可以分解為行列方式,類似**的定義
行1列1 (一般為表頭)
行1列2
行2列1
行2列2
行3列1
行3列3
test.csv
name,age
zhangsan,45
wangmaz,40
f=open(name)
ls=for line in f:
line=line.replace("\n","")
f.close
ls=[,,]
f=open(fname,'w')
for item in ls:
f.write(",".jon(item)+"\n") # python 字串拼接
f.close()
office的電子**excel是最常用的軟體
需要安裝python pandas,xlrd和lxwt的包
from __future__ import p_function
import pandas as pd
from pandas import read_execl
#6行4列
pd.set_option('display.max_columns',4)
pd.set_option('display.max_rows',6)
print(df)
Python 資料維度處理
list temp list range 0 5 0,1,2,3,4 array temp np.array range 5 10 array 5,6,7,8,9 df temp pd.dataframe range 10 15 range 15 20 0 1 2 3 4 0 10 11 12 13...
python之檔案和資料的處理
檔案分為文字檔案和二進位制檔案,但是本質上所有的檔案都是二進位制檔案,只是展示的方式不同。在python中,檔案的狀態分為兩種 儲存狀態和占用狀態。要處理檔案,就必須使檔案處於占用狀態。我們使用a open 檔名,開啟模式 來開啟檔案使之成為占用狀態,使用a.close 來關閉檔案,使之成為儲存狀態...
資料擴充和資料預處理
參考 解析深度學習 卷積神經網路原理與視覺實踐 資料擴充 有效的資料擴充不僅能擴充訓練樣本數量,還能增加訓練樣本的多樣性,一方面可避免過擬合,另一方面又會帶來模型效能的提公升,但實際使用時需要 量體裁衣 注 如果是 影象檢測任務 或者是 影象分割任務 記得 將 影象資料 和 標記資料 進行 同步擴充...