利用python處理txt文字,調整格式

2021-10-02 16:19:49 字數 1182 閱讀 3936

具體任務為:將其中人名分離,每個單獨一行,

待處理文字如下:

(實驗可以自己複製)

○田德懋○薛濬○王頒○楊慶○郭俊○田翼○紐回○劉士俊○郎方貴○翟普林○李德饒○華秋○徐孝肅

列傳第三十八○循吏○梁彥光○樊叔略○趙軌○房恭懿○公孫景茂○辛公義○柳儉(郭絢 敬肅)○劉曠○王伽○魏德深

列傳第三十九○酷吏○厙狄士文○田式○燕榮○趙仲卿○崔弘度(弟崔弘昇)○元弘嗣○王文同

列傳第四十○儒林○元善○辛彥之○何妥(蕭該包凱)○房暉遠○馬光○劉焯○劉炫○褚輝○顧彪○魯世達○張冲○王孝籍

列傳第四十一○文學○劉臻○王頍○崔儦○諸葛潁○孫萬壽○王貞○虞綽(辛大德)○王冑○庾自直○潘徽○杜正玄(弟杜正藏)○常得志○尹式○劉善經○祖君彥○孔德紹○劉斌

列傳第四十二○隱逸○李士謙○崔廓(子崔賾)○徐則○張文詡

列傳第四十三○藝術○庾季才(子庾質 盧太翼 耿詢)○韋鼎○來和○蕭吉(楊伯醜 臨孝恭 劉祐)○張胄玄○許智藏○萬寶常(王令言)

列傳第四十四○外戚○高祖外家呂氏○獨孤羅(弟獨孤陀)○蕭巋(子蕭琮 琮弟蕭瓛)

列傳第四十五○列女○蘭陵公主○南陽公主○襄城王恪妃○華陽王楷妃○譙國夫人○鄭善果母○孝女王舜○韓覬妻○陸讓母○劉昶女○鍾士雄母○孝婦覃氏○元務光母○裴倫妻○趙元楷妻

列傳第四十六○東夷○高麗○百濟○新羅○靺鞨○流求國○倭國

列傳第四十七○南蠻○林邑○赤土○真臘○婆利

列傳第四十八○西域○吐谷渾○黨項○高昌○康國 ○安國○石國○女國○焉耆○龜茲○疏勒○于闐○汗○吐火羅○挹怛○公尺國○史國○曹國○何國○烏那曷○穆國○波斯○漕國○附國

列傳第四十九○北狄○突厥○西突厥○鐵勒○奚○契丹(室韋)

列傳第五十○宇文化及(弟宇文智及)司馬德戡 裴虔通○王世充 段達

**如下:

# python3.7(based conda)

for line in open("/users/hans/codes/a/test.txt"):

# print(line)

s = ""

for c in line:

if(c == "○" or c == " "):

c = '\n'

s += c

print(s)

# with open('data.txt','a') as f:

# f.writelines(s)

利用python處理txt檔案

前段時間做公司乙個自動翻譯專案需要處理大量的文案字段,手工去做簡直不大可能 懶 因此借用python指令碼自動化處理掉了,在此記錄一下。import linecache def outputfile i,j,n zh file zh.read decode utf 8 encode gbk igno...

python 處理文字( txt檔案)

參考 if pos 1 content content pos content add content pos 參考 findall 注意 返回的是匹配的字串,若沒有匹配,返回,而不是什麼也不返回 參考 keys a b c values 1,2,3 dictionary dict zip keys...

處理 TXT 文字技巧

在一些場景會碰到需要從 txt 文字檔案提取需要的 txt 文字並沒有固定的格式,所以基本上每乙個不同的 txt 文字都需要單獨寫程式,下面是一些我在專案中用到的 txt 文字處理技巧。有用到的 python 處理 txt 開啟 txt 文字 with open txt r as f 逐行讀取 tx...