ForeSpider資料採集軟體之鏈結抽取

前嗅forespider資料採集軟體是一款通用性網際網路資料採集軟體，軟體幾乎可以採集網際網路上所有公開的資料，通過視覺化的操作流程，從建表、過濾、採集到入庫一步到位。同時軟體內建了強大的爬蟲指令碼語言。如果有通過視覺化採集不到的內容，都可以通過簡單幾行**，實現強大的指令碼採集。

案例使用的是大眾點評網，要抽取下面的翻頁鏈結。

第一步先看每一頁的鏈結位址有沒有規律。

【第二頁】

【第三頁】

第一行**：定義乙個url類的變數u

第三行**：u.tmplid是這個鏈結抽取所要關聯的模板id，這裡是翻頁，所以關聯自身模板

通過findclass的方式，從原始碼中得到總頁數，然後使用for迴圈拼接每一頁的鏈結。一共才用了12行（其中還包含了兩行注釋）就得到了自己想要的鏈結，是不是非常的簡單呢，希望大家多看幫助文件，很多問題在幫助文件裡就有了答案（偷偷告訴你我也經常遇到不會的然後去看文件）。

前嗅forespider是一款非常簡單好用的通用型資料採集軟體，操作簡單功能強大的同時還保證了採集速度，完全可以滿足企業級使用者需求。