有乙份試題,每個問題以question no開始,然後是該題的答案,以answer:開始。
為了摘出乙份只包含問題,不包含答案的試題,嘗試用ultraedit的正規表示式替換,
但不支援跨行替換。
於是寫了下面的python程式。
from sys import*
fp=open(argv[1],'r')
fo=open(argv[2],'w')
a=fp.readline()
sym=0
while a!='':
if a[0:len(argv[3])]==argv[3]:
sym=1
if sym==1 and a[0:len(argv[4])]==argv[4]:
sym=0
if sym==0 :
fo.write(a)
a=fp.readline()
fo.close()
fp.close()
把它命名為gjj.py
然後在windows xp控制台視窗輸入命令列:
python gjj.py tk007.txt out007.txt "answer:" "question no"
就可以把tk007.txt中的答案部分刪除。
joomla中如何去掉分類文章列表中的文章序號?
找到這個檔案 joomla根路徑 components com content views category tmpl default items.php 將其複製粘帖至你的模板中,路徑為 自定義模板路徑 html com content category default items.php 開啟該...
統計文章詞頻(python實現)
統計出文章重複詞語是進行文字分析的重要一步,從詞頻能夠概要的分析文章內容。2.建立用於詞頻計算的空字典 3.對文字的每一行計算詞頻 4.從字典中獲取資料對到列表中 5.對列表中的資料交換位置,並排序 6.輸出結果 2.網上下來的英文文章可能有一些不是utf 8編碼,並且文章中有一些字元包含一些格式符...
用python統計英文文章詞頻
import re with open text.txt as f 讀取檔案中的字串 txt f.read 去除字串中的標點 數字等 txt re.sub d s txt 替換換行符,大小寫轉換,拆分成單詞列表 word list txt.replace n replace lower split ...