lxml是python中與xml及html相關功能中最豐富和最容易使用的庫。lxml並不是python自帶的包,而是為libxml2和libxslt庫的乙個python化的繫結。它與眾不同的地方是它兼顧了這些庫的速度和功能完整性,以及純python api的簡潔性,與大家熟知的elementtree api相容但比之更優越!但安裝lxml卻又有點麻煩,因為存在依賴,直接安裝的話用easy_install, pip都不能成功,會報gcc錯誤。下面列出來windows、linux下面的安裝方法:
【windows系統】
先確保python已經安裝好,環境變數也配置好了,相應的的easy_install、pip也安裝好了.
1. 執行 pip install virtualenv
c:\>pip install virtualenv
requirement already satisfied (use --upgrade to upgrade): virtualenv in c:\python27\lib\site-package
s\virtualenv-12.0.4-py2.7.egg
note:
lxml-2.3-py2.7-win-amd64.egg (md5) # python egg
或lxml-2.3.win-amd64-py2.7.exe (md5) # ms windows installer
3.執行 easy_install lxml-2.3-py2.7-win-amd64.egg
d:\downloads>easy_install lxml-2.3-py2.7-win-amd64.egg # 進入該檔案所在目錄執行該命令
processing lxml-2.3-py2.7-win-amd64.egg
creating c:\python27\lib\site-packages\lxml-2.3-py2.7-win-amd64.egg
extracting lxml-2.3-py2.7-win-amd64.egg to c:\python27\lib\site-packages
adding lxml 2.3 to easy-install.pth file
installed c:\python27\lib\site-packages\lxml-2.3-py2.7-win-amd64.egg
processing dependencies for lxml==2.3
finished processing dependencies for lxml==2.3
note:
1.可用exe可執行檔案,方法更簡單直接安裝就可以
2.可用easy_install安裝方式,也可以用pip的方式
#再執行下,就安裝成功了!
>>> import lxml
>>>
3.如用pip安裝,常用命令就是:
4.【
linux系統
】因為lxml依賴的包如下:
libxml2, libxml2-devel, libxlst, libxlst-devel, python-libxml2, python-libxslt
所以安裝步驟如下:
第一步: 安裝 libxml2
第二步: 安裝 libxslt
第三步: 安裝 python-libxml2 和 python-libxslt
第四步: 安裝 lxml
參考官方文件:
Python中lxml模組的安裝
本文 這裡,感謝原文作者的分享,親測有效,希望可以幫到更多的童鞋。如有侵權,請告知。lxml是python中與xml及html相關功能中最豐富和最容易使用的庫。lxml並不是python自帶的包,而是為libxml2和libxslt庫的乙個python化的繫結。它與眾不同的地方是它兼顧了這些庫的速度...
Python 之lxml解析模組
lxml 是 乙個html xml的解析器,主要的功能是如何解析和提取 html xml 資料。一 lxml示例 1 初步 使用 lxml 的 etree 庫 from lxml import etree text 利用etree.html,將字串解析為html文件 html etree.html ...
lxml模組的使用
安裝 pip install lxml 匯入lxml 的 etree 庫 匯入沒有提示不代表不能用 from lxml import etree 利用etree.html,將字串轉化為element物件,element物件具有xpath的方法,返回結果的列表,能夠接受bytes型別的資料和str型別...