簡單的DOM Tree使用

2021-07-16 23:48:38 字數 990 閱讀 2724

因為需要從網頁上找出學生資訊,本來是要準備用正規表示式來匹配,但是翻遍了各種答案找到的匹配中文正則式都不對,大寫的無奈,然後找到了這個辦法來查詢資訊—dom tree。

dom 樹是指通過dom將html頁面進行解析。並生成的html tree樹狀結構和對應訪問方法。採用一種直觀且一致的方式將html文件進行模型化處理,並藉此提供訪問、導航和操作頁面的簡易程式設計介面。

在網上找到乙個覺得很簡單易懂哎~~

對應的**如下:

lang="en">

my titletitle>

head>

href="">my linka>

body>

html>

dom內部處理全部都是utf8的,所以除了傳入內容要utf8化之外,傳入的內容中最好還有宣告字符集的html**,比如我從某**爬取到的網頁資訊,雖然已經用 mb_convert_encoding($string, 「utf-8」,」gb2312」)整體處理為utf-8格式,但是**開頭還是有本文編碼格式的說明,所以手動給它加頭。

1.建立乙個物件

$dom

=new domdocument();

2.制定載入那個html,解析那個檔案

$dom

->loadhtml("".

$res2);

3.新建陣列

$user

=array();

4.獲取標籤中名為id=

"xm"的成員值

$user

=$dom

->getelementsbyid("xm")->nodevalue;

英文中文都可以順利找到。恩,挺棒的,可憐我研究了半天的正規表示式,死活用不了,用不了,不了,了!!!!

vcbuild的簡單使用

vcbuild 命令列 更新 2007 年 11 月 vcbuild 工具使用以下命令列語法來生成 visual c 專案和解決方案。複製 vcbuild options project solution config all 標誌 options生成選項。有關更多資訊,請參見 vcbuild 選項...

QList的簡單使用

qlistlist list 1 2 3 4 5 6 7 8 qlist的插入 voidinsert int i,const t value 在qlist其中某個位置插入value,假如沒 宣告i i 預設size 及在最後插入value iteratorinsert iterator before...

QTreeWidget的簡單使用

qtreewidget是一種樹形的部件,它以樹的形式顯示各個項,它的每個項使用qtreewidgetitem來表示。qtreewidgetitem的值的表示都是用qstringlist來表示的。簡單的說明一下 for int i 0 i 3 i for int i 0 i 3 i treewidge...