1.遍歷資料夾
import os
import os.path
rootdir = 「d:
\data」 # 指明被遍歷的資料夾
for parent,dirnames,filenames in os.walk(rootdir)
: #三個引數:分別返回1.父目錄 2.所有資料夾名字(不含路徑) 3.所有檔案名字
for dirname in dirnames: #輸出資料夾資訊
print "parent is:"
+ parent
print "dirname is"
+ dirname
for filename in filenames: #輸出檔案資訊
print "parent is"
:+ parent
print "filename is:"
+ filename
print "the full name of the file is:"
+ os.path.join(parent,filename) #輸出檔案路徑資訊
#windows下為:d:
\data\query_text\el_00154
2.查詢中文字元
import re
pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?'
) #判斷是否為中文的正規表示式
f=open(
"d:\\workspace\\saas\\core\\admin\\controller\\sale\\ctl.tools.php"
) #開啟要提取的檔案
fw=open(
"getdata.txt"
,"w"
)#開啟要寫入的檔案
for line in f.readlines(
): #迴圈讀取要讀取檔案的每一行
m=pchinese.findall(line.decode(
'utf8'
)) #使用正則表達獲取中文
if m:
str1=
'|'.join(m)
#同行的中文用豎槓區分
str2=str1
fw.write(str2)
#寫入檔案
fw.write(
"\n"
)#不同行的要換行
f.close(
)fw.close()#
3.遍歷資料夾,並將檔案中中文寫入檔案
#coding=utf-8
import re, os
def find_chn(infile, outfile)
:pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?'
) #判斷是否為中文的正規表示式
f=open(infile) #開啟要提取的檔案
flag = 0
for line in f.readlines(
): #迴圈讀取要讀取檔案的每一行
if line.find(
'//')!
=-1:
#如果有注釋,直接跳過
continue
if line.find(
'/*')!
=-1 or line.find('')
!=-1:flag = 0
continue
if flag=
=1:continue
m=pchinese.findall(line.decode(
'utf8'
)) #使用正則表達獲取中文
if m:
str1=
'|'.join(m)
#同行的中文用豎槓區分
str2=str1
outfile.write(str2)
#寫入檔案
outfile.write(
"\n"
)#不同行的要換行
print str2
f.close(
)fw=open(
"getdata.txt"
,"a+"
)#開啟要寫入的檔案
for parent,dirnames,filenames in os.walk(
"d:\\workspace\\saas\\core\\shop\\view\\gallery\\"
): #三個引數:分別返回1.父目錄 2.所有資料夾名字(不含路徑) 3.所有檔案名字
for filename in filenames: #輸出檔案資訊
print os.path.join(parent,filename)
find_chn(os.path.join(parent,filename)
, fw)
fw.close()#
python 遍歷資料夾
在python中,檔案操作主要來自os模組,主要方法如下 os.listdir dirname 列出dirname下的目錄和檔案 os.getcwd 獲得當前工作目錄 os.curdir 返回當前目錄 os.chdir dirname 改變工作目錄到dirname os.path.isdir nam...
python 遍歷資料夾
import os import os.path rootdir r d data 指明被遍歷的資料夾 for parent,dirnames,filenames in os.walk rootdir 三個引數 分別返回1.父目錄 2.所有資料夾名字 不含路徑 3.所有檔案名字 for dirnam...
python 遍歷資料夾
遍歷目錄 使用os.walk path 其返回值是乙個三元素元組 目錄parent,目錄parent下的目錄dirnames,目錄parent下的檔案filenames 返回值分析 目錄parent 是乙個純str 目錄parent下的目錄dirnames 是乙個子資料夾集合 目錄parent下的檔...