最近在準備複試的過程中要查詢學校導師的資訊,乙個乙個看,然後分析,有點費事,所以想爬蟲爬去老師的所有資訊,然後用以前寫的分析工具(雲標籤的那個)進行分析。
本專案由兩部分組成,
1、提取相關的網頁html資訊。
2、利用正規表示式提取有用資訊
這兩部分都比較簡單,就不詳述了。
直接上**:
#include "spider.h"
#include "ui_spider.h"
#include #include #include #include #include spider::spider(qwidget *parent) :
qwidget(parent),
ui(new ui::spider)
spider::~spider()
//利用正規表示式獲取有用資訊
void spider::getusefuldata()
void spider::on_ok_pushbutton_clicked()
}
還有,最終還沒把專案完成,複試就開始了,哎,最後還是乙個乙個 手動分析的。o(╯□╰)。
專案的原始碼在這兒。
QT實現簡易計算器
定義a用來儲存lineedit顯示內容 定義b用來儲存運算子等 ifndef widget h define widget h include qt begin namespace namespace ui qt end namespace class widget public qwidget e...
簡易文字爬蟲
正規表示式 1 使用re.findall 所有符合條件的 一般查詢列表結果就是所獲得值 re.search 一條符合記錄的 通過match物件內的group編號或命名,獲得對應的值 title re.research html,re.s group 1 能包括換行符 使用sub 替換 實現換頁功能 ...
nodejs簡易爬蟲
我的爬蟲程式是用nodejs寫的,因為最近在學這個東西,其中使用了express框架,以及cheerio和superagent兩個模組。cheerio模組是nodejs處理html內容的神器,例如var cheerio.load html 將頁面的html內容載入下來後,便可使用jquery語法進行...