介紹python的一種較為通用的讀取檔案並進行格式化的方法。
第一種檔案格式:
一行資料是乙個特徵向量,最後一項是標籤,表示類別。資料之間用空格分隔。目的是輸入這樣的檔案路徑,得到它格式化形成的特徵向量和標籤向量。
**
def
filetonumpy
(filename)
:file
=open
(filename)
file_lines =
file
.readlines(
) numberoflines =
len(file_lines)
dataarray = np.zeros(
(numberoflines,3)
) labels =
index =
0for line in file_lines:
line = line.strip(
)# 引數為空時,預設刪除開頭、結尾處空白符(包括'\n', '\r', '\t', ' ')
formline = line.split(
'\t'
) dataarray[index,:]
= formline[0:
3](formline[-1
])) index +=
1return dataarray, labels
filename =
"datingtestset.txt"
dataarray, labels = filetonumpy(filename)
第二種檔案格式類似,但是用逗號分隔
這種檔案是csv格式檔案,把它當作普通檔案來處理。
**
def
filetonumpy_2
(filename)
:file
=open
(filename)
lines =
file
.readlines(
) length =
len(lines)
data = np.zeros(
(length,3)
) labels =
index =
0for line in lines:
line = line.strip(
) one = line.split(
',')
data[index,:]
= one[0:
-1]-
1]) index +=
1return data, labels
filename =
"testdata.txt"
data, labels = filetonumpy_2(filename)
print
(data)
print
(labels)
linux 檔案格式化
1 按兩下小寫g,即gg,定位游標到第一行。2 按住shift v,即大寫v,進入視覺化編輯的列編輯模式。3 shift g,即大寫g,選中整個 4 按下等號 格式化所有 libxml2 是乙個xml的c語言版的解析器,本來是為gnome專案開發的工具,是乙個基於mit license的免費開源軟體...
python 讀寫檔案格式化輸出
python讀寫檔案 1.open file object open thefile.txt try all the text file object.read finally file object.close 2.讀檔案 讀文字檔案 input open data r 第二個引數預設為r inp...
Python格式化JSON檔案
之前工作中有乙個需求是要格式化json檔案,遇到乙個問題,是要把乙個json檔案裡面的內容格式化一下,在此做個記錄 import json class jsonformat 初始化json原始檔和新檔案位址 def init self,filepath,newpath self.filepath f...