用python 解析XML 的幾種常見方法的介紹

2021-08-29 14:15:05 字數 716 閱讀 3955

xml (extensible markup language) 指的是可擴充套件標記語言,被設計用來傳輸和儲存資料,已經日趨成為當前許多新技術的核心,在不同的領域都有著不同的應用,它是web 發展到一定階段的必然產物

python 解析xml 常見的有三種方法

一是 xml.dom.* 模組, 它是w3c dom api 的實現,若需要處理dom api 則該模組很適合,注意 xml.dom 包裡有許多模組,須區分它們間的不同

二是, xml.sax.* 模組,它是sax api 的實現,這個模組犧牲了便捷性來換取速度和記憶體占用, sax 是乙個基於事件的api, 這就意味著它可以「在空中」 處理龐大數量的文件,不用完全載入進記憶體

三是,xml.etree.elementtree 模組(簡稱et) , 它提供了輕量級的python 式的api, 相對於dom 來說,et 快了很多,而且有很多令人愉悅的api 可以使用,相對於sax 來說et的et.iterparese 也提供了「在空中」的處理方式,沒有必要載入整個文件到記憶體,et 的效能的平均值和sax 差不多,但是api 的效率更高一點且使用起來很方便。

1. xml.etree.elementtree 

elementtree 生來就是為了處理xml, 它是python 標準庫中有兩種實現: 一種是純python 實現的, 如xml.etree.elementtree, 另一種是速度快一點的xml.etree.celementtree. 

** 

XML幾種解析方式

一 通過dom解析讀取檔案 documentbuilde ctory factory documentbuilde ctory.newinstance documentbuilder builder factory.newdocumentbuilder document doc builder.pa...

解析XML的幾種方式 DOM SAX PULL

解析器讀入整個文件,然後構建乙個主流記憶體的樹結構,然後 就可以使用dom介面來操作這個樹結構。優點 缺點 適用於 一旦解析了文件還需多次訪問這些資料 硬體資源充足 記憶體,cpu dom解析步驟 建立解析器工廠 獲得解析器工廠 接受乙個xml文件作為輸入引數名,並得到乙個xml的文件物件 docu...

Python解析xml檔案

war,thriller 2003 pg10 talk about a us japan war science fiction 1989r8 a schientific fiction action 4 pg10 vash the stampede comedy vhspg 2viewable b...