具體任務為:將其中人名分離,每個單獨一行,
待處理文字如下:
(實驗可以自己複製)
○田德懋○薛濬○王頒○楊慶○郭俊○田翼○紐回○劉士俊○郎方貴○翟普林○李德饒○華秋○徐孝肅
列傳第三十八○循吏○梁彥光○樊叔略○趙軌○房恭懿○公孫景茂○辛公義○柳儉(郭絢 敬肅)○劉曠○王伽○魏德深
列傳第三十九○酷吏○厙狄士文○田式○燕榮○趙仲卿○崔弘度(弟崔弘昇)○元弘嗣○王文同
列傳第四十○儒林○元善○辛彥之○何妥(蕭該包凱)○房暉遠○馬光○劉焯○劉炫○褚輝○顧彪○魯世達○張冲○王孝籍
列傳第四十一○文學○劉臻○王頍○崔儦○諸葛潁○孫萬壽○王貞○虞綽(辛大德)○王冑○庾自直○潘徽○杜正玄(弟杜正藏)○常得志○尹式○劉善經○祖君彥○孔德紹○劉斌
列傳第四十二○隱逸○李士謙○崔廓(子崔賾)○徐則○張文詡
列傳第四十三○藝術○庾季才(子庾質 盧太翼 耿詢)○韋鼎○來和○蕭吉(楊伯醜 臨孝恭 劉祐)○張胄玄○許智藏○萬寶常(王令言)
列傳第四十四○外戚○高祖外家呂氏○獨孤羅(弟獨孤陀)○蕭巋(子蕭琮 琮弟蕭瓛)
列傳第四十五○列女○蘭陵公主○南陽公主○襄城王恪妃○華陽王楷妃○譙國夫人○鄭善果母○孝女王舜○韓覬妻○陸讓母○劉昶女○鍾士雄母○孝婦覃氏○元務光母○裴倫妻○趙元楷妻
列傳第四十六○東夷○高麗○百濟○新羅○靺鞨○流求國○倭國
列傳第四十七○南蠻○林邑○赤土○真臘○婆利
列傳第四十八○西域○吐谷渾○黨項○高昌○康國 ○安國○石國○女國○焉耆○龜茲○疏勒○于闐○汗○吐火羅○挹怛○公尺國○史國○曹國○何國○烏那曷○穆國○波斯○漕國○附國
列傳第四十九○北狄○突厥○西突厥○鐵勒○奚○契丹(室韋)
列傳第五十○宇文化及(弟宇文智及)司馬德戡 裴虔通○王世充 段達
**如下:
# python3.7(based conda)
for line in open("/users/hans/codes/a/test.txt"):
# print(line)
s = ""
for c in line:
if(c == "○" or c == " "):
c = '\n'
s += c
print(s)
# with open('data.txt','a') as f:
# f.writelines(s)
利用python處理txt檔案
前段時間做公司乙個自動翻譯專案需要處理大量的文案字段,手工去做簡直不大可能 懶 因此借用python指令碼自動化處理掉了,在此記錄一下。import linecache def outputfile i,j,n zh file zh.read decode utf 8 encode gbk igno...
python 處理文字( txt檔案)
參考 if pos 1 content content pos content add content pos 參考 findall 注意 返回的是匹配的字串,若沒有匹配,返回,而不是什麼也不返回 參考 keys a b c values 1,2,3 dictionary dict zip keys...
處理 TXT 文字技巧
在一些場景會碰到需要從 txt 文字檔案提取需要的 txt 文字並沒有固定的格式,所以基本上每乙個不同的 txt 文字都需要單獨寫程式,下面是一些我在專案中用到的 txt 文字處理技巧。有用到的 python 處理 txt 開啟 txt 文字 with open txt r as f 逐行讀取 tx...