用Python實現去掉文章中特定的段落

2021-06-15 20:05:49 字數 637 閱讀 6137

有乙份試題,每個問題以question no開始,然後是該題的答案,以answer:開始。

為了摘出乙份只包含問題,不包含答案的試題,嘗試用ultraedit的正規表示式替換,

但不支援跨行替換。

於是寫了下面的python程式。

from sys import*

fp=open(argv[1],'r')

fo=open(argv[2],'w')

a=fp.readline()

sym=0

while a!='':

if a[0:len(argv[3])]==argv[3]:

sym=1

if sym==1 and a[0:len(argv[4])]==argv[4]:

sym=0

if sym==0 :

fo.write(a)

a=fp.readline()

fo.close()

fp.close()

把它命名為gjj.py

然後在windows xp控制台視窗輸入命令列:

python gjj.py tk007.txt out007.txt "answer:" "question no"

就可以把tk007.txt中的答案部分刪除。

joomla中如何去掉分類文章列表中的文章序號?

找到這個檔案 joomla根路徑 components com content views category tmpl default items.php 將其複製粘帖至你的模板中,路徑為 自定義模板路徑 html com content category default items.php 開啟該...

統計文章詞頻(python實現)

統計出文章重複詞語是進行文字分析的重要一步,從詞頻能夠概要的分析文章內容。2.建立用於詞頻計算的空字典 3.對文字的每一行計算詞頻 4.從字典中獲取資料對到列表中 5.對列表中的資料交換位置,並排序 6.輸出結果 2.網上下來的英文文章可能有一些不是utf 8編碼,並且文章中有一些字元包含一些格式符...

用python統計英文文章詞頻

import re with open text.txt as f 讀取檔案中的字串 txt f.read 去除字串中的標點 數字等 txt re.sub d s txt 替換換行符,大小寫轉換,拆分成單詞列表 word list txt.replace n replace lower split ...