1.讀取文字檔案資料(.txt結尾的檔案)或日誌檔案(.log結尾的檔案)
以下是檔案中的內容,檔名為data.txt(與data.log內容相同),且處理方式相同,呼叫時改個名稱就可以了:
以下是python實現**:
# -*- coding:gb2312 -*-
import json
defread_txt_high
(filename):
with open(filename, 'r') as file_to_read:
list0 = #檔案中的第一列資料
list1 = #檔案中的第二列資料
while
true:
lines = file_to_read.readline() # 整行讀取資料
ifnot lines:
break
item = [i for i in lines.split()]
data0 = json.loads(item[0])#每行第乙個值
data1 = json.loads(item[1])#每行第二個值
return list0,list1
aa,bb = read_txt_high('data.txt')
print aa
print bb
若是日誌檔案(.log結尾的檔案),輸入以下:
aa,bb = read_txt_high('data.log')
print aa
print bb
執行結果如下:
2.讀取.xml結尾的檔案
xml檔案的名稱為abc.xml, 內容如下圖所示:
以下是實現**:
# -*- coding:gb2312 -*-
# coding = utf-8
from pylab import *
import xml.dom.minidom
defread_xml
(): dom = xml.dom.minidom.parse('abc.xml')#開啟xml文件
cc=dom.getelementsbytagname('caption')
list_str = #字串
for item in cc:
bb = dom.getelementsbytagname('maxid')
list_fig =
for item in bb:
su = list_fig[0].encode("gbk")
list_fig2 = su.split(",")
list_fig_num =
for i in list_fig2:
ee = dom.getelementsbytagname('time')
list_tim =
for item in ee:
sg = list_tim[0].encode("gbk")
list_time = sg.split(",")
gg = dom.getelementsbytagname('font_size')
g1 =
for item in gg:
su = g1[0].encode("gbk")
return list_str,list_fig_num,list_time,su
呼叫此函式如下所示:
a,b,c,d = read_xml()
print a
print b
print c
print d
輸出結果如下圖所示:
3.讀取excel檔案資料,並將其存入list列表中
excel**中的資料如下圖所示,**命名為data.xlsx:
首先將id列中的資料儲存到列表list_col中,實現**如下所示:
# -*- coding: utf-8 -*-
import xlrd
import json
defread_ex_stop_ptline
():# 開啟檔案
workbook = xlrd.open_workbook(r'data.xlsx')
sheet = workbook.sheet_by_name('ptline')
list_col =
for i in range(1,sheet.nrows):
c = sheet.cell(i,3).value
print list_col
呼叫此函式,輸出結果如下:
以下將linkidsequence列資料存放到乙個list中,即list_ele中,實現**如下:
# -*- coding: utf-8 -*-
import xlrd
import json
defread_ex_stop_ptline
():# 開啟檔案
workbook = xlrd.open_workbook(r'data.xlsx')
sheet = workbook.sheet_by_name('ptline')
list_ele = #第八列的所有資料放入乙個list中
for i in range(1,sheet.nrows):
c = sheet.cell(i, 8).value
cc = json.loads(c) #第八列的每個單元格處理為乙個list
for j in range(len(cc)):
print list_ele
呼叫函式read_ex_stop_ptline,輸出結果如下圖所示: python讀取文字檔案資料
常用資料檔案內容格式如下 10,張三,22,男,172,57,95 11,李四,25,男,180,65,90 12,王紅,23,女,160,50,99 從該文字資料可以看出,一般為 一行一樣本,一列一特徵,每個特徵之間用特殊字元 如逗號,空格 分割 1 csv 檔案 csv檔案 逗號分割值檔案 nu...
python各種檔案讀取
目錄 1 json檔案 2 csv 3 用with來讀取檔案,可避免忘掉f.close 4 用pandas讀取excel csv檔案 1 json檔案樣式 資料儲存在鍵值中 鍵值對間由逗號分隔 花括號用於儲存鍵值對資料組成的物件 方括號用於儲存鍵值對資料組成的陣列 多個物件組成 2 json檔案操作...
Python資料分析筆記 檔案資料讀取
讀取檔案內容首行 path c users etisan desktop a.txt open path readline 注 檔案路徑要用雙反斜槓 第乙個 的作用是轉義字元 讀取檔案內容某一行 records line for line in open path records 1 匯入json,...