今天又幫女朋友處理了一下,她的實驗資料,因為python是一年前經常用,最近找工作,用的是c,c++,python的有些東西忘記了,然後就一直催我,說我弄的慢,弄的慢,你自己弄啊,煩不煩啊,逼逼叨叨的,最後還不是我給弄好的?呵呵
好的,資料是這樣的,我截個圖
我用紅括號括起來的,就是我所要提取的資料
其中lossstotal.txt是我要提取的原始資料,考慮兩種方法去提取,前期以為所要提取行的資料是有一定規律的,後來發現,並不是,所以,我考慮用正則來提取,經過思考以後,完成了資料的提取,如下午所示,資料變的非常好看
**如下:
#coding:utf-8
#__author__ ='dell'
import re
f1=file('losstotal.txt','r')
data1=f1.readlines()
# print data1
f程式設計客棧1.close()
results =
f2 = open('loss2.txt', 'w')
# # 按照特定行提取,發現後面的行並無規律
# i = 0
# for line in data1:
# i+=1
# # print line
# if((i-1)%3==0):
# f2.write(line)
# print line
# 利用正規表示式
for line in data1:
data2=line.split()
# print data2
for i in data2:
n = re.findall(r"iteration", i)
# m=re.findall(r"loss", i)
if n:
# print line
f2.writelines(line)
f2.close()
f3=file('loss2.txt','r')
data3=f3.readlines()
# print data1
f3.close()
f4 = open('loss3.txt', 'w')
for line in data3:
data4=line.split()
# print data2
for i in data4:
n = re.findall(r"loss", i
# m=re.findall(r"loss", i)
if n:
print line
f4.writelines(line)
f4.close()
# 去掉逗號
f5=open('loss3.txt','r')
data5=f5.reagypxuggrhd()
f5=data5.replace(',',' ')
f6=file('lossfinal.txt','w')
f6.write(f5)
f6.close()
# # 去掉等號=
f7=open('lossfinal.txt','r')
data7=f7.read()
f7=data7.replace('=',' ')
f8=file('lossfinal.txt','w')
f8.write(f7)
f8.close()
# data3=lin.spl
# for j in data3:
# m=re.findall(r"loss",i)
# if m:
# print lin
# # m=re.findall(r"sgd_so程式設計客棧lver.cpp",i)
# n=re.findall(r"iteration",i)
我在同樣的目錄下,還建立了
這幾個txt檔案,要不然,**跑不通的喲。
解釋:我連續用了兩個正則,各自把含有特定字串的行進行提取,兩個寫一起,發現還是不太會,所以分開寫了,但是結果還是完成的不錯!
本文標題: python提取具有某種特定字串的行資料方法
本文位址:
python 關鍵字提取
jieba 關鍵字提取 import jieba.analyse tags jieba.analyse.extract tags str,topk 3 str是提取關鍵字的內容,topk是提取關鍵字數 print join tags tf idf關鍵字提取 是用於資訊檢索和文字挖掘的加權技術。是評估...
python 提取目錄中特定型別的檔案
python使用 os 和 re 模組提取目錄中特定型別的檔案,這兩個模都是安裝python自帶的,所以不需要安裝。思路 使用os庫lilstdir獲取資料夾中的所有檔名,然後帶上資料夾路徑組合成為完整絕對路徑,然後去判斷該路徑檔案的型別,如果是檔案,使用re庫正則相關函式去篩選出特定字尾的檔案 如...
python提取txt中的特定字元工具
由於工作需要需要提取乙個txt檔案中的特定字元 原始檔案結構如下 logon name xiaoming display name 中國小明 user password 123 org name logon name xiaohuang display name 中國小黃 user password...