有道詞典單詞xml轉xlsx格式

2021-08-31 06:51:50 字數 1221 閱讀 4901

今天想複習一下有道詞典裡面收藏的單詞,結果只能匯出.bin, .xml, .txt格式,但是我想把它放在excel裡更容易操作排序、染色等,所以就提取了xml格式,然後用python轉成了xlsx格式。具體**如下:

import xml.etree.elementtree as et

import pandas as pd

import numpy as np

tree = et.parse(

'words.xml'

)root = tree.getroot(

)words = pd.dataframe(columns =

['word'

,'trans'

,'phonetic'])

for item in root:

df = pd.dataframe(

, index = item)

print

(df)

words = pd.concat(

[words, df]

, ignore_index =

true

) words = words.drop_duplicates(

)words.to_excel(

'words1.xlsx'

, sheet_name =

'1')

在這裡面有兩個問題目前沒有看懂,乙個是

words = words.drop_duplicates(

)

,為什麼要用這個,應為不用他的話每個單詞會列印5遍,沒辦法,我就把重複項去掉了,我也不知道為什麼會列印5遍。另外乙個就是在sublime text 3中寫

words.to_excel(

'words1.xlsx'

, sheet_name =

'1')

的時候,會出現

unicodeencodeerror:

'gbk' codec can't encode character '\u028c' in position 134

: illegal multibyte sequence

可能是因為,『gbk』搞不定音標吧,我猜的啊,不知道怎麼解決,反正我在jupyter notebook中跑出來了。

就這樣吧!

有道手機詞典

今天開啟有道詞典,無意中發現多了一行字 詞典手機版更新 多款機型支援攝像頭查詞 oh my lady gaga,居然可以支援攝像頭查詞!就實用性上來說,可能速度還不夠快,把攝像頭對準單詞,等著它識別出來的功夫其實手動早就輸進去了,但它顯示了計算機視覺在手機上廣闊的應用前景,設想以後的搜尋應該是語音 ...

C 版有道詞典

原理 通過c 獲取要查詞彙的網頁資料,根據關鍵字擷取需要的解釋,並顯示出來。圖形介面設計 原始碼 using system using system.collections.generic using system.componentmodel using system.data using sys...

網易有道詞典 for Mac

網易有道詞典 mac版作為一款英語 日語 韓語 法語免費全能查詞翻譯軟體,有道詞典在多年來致力於為使用者提供更優質的翻譯服務,針對mac平台特性,特別推出全新的版本,網易有道詞典免費版更符合mac使用者翻譯使用習慣。發布多年以來,成為mac系統下必備的詞典軟體,在同類軟體排行位居前列。網易有道詞典 ...