1.新建站點
2.在該站點上新建任務
3.**規則,檢視一下源**,發現這些****在乙個區域裡,我們可以這樣寫規則
測試一下,正確,下邊該採內容了。
4.內容規則製作。我們隨便找個頁面,如先測試一下
看了一下,裡邊是有我們需要的東西的,這說明火車可以採它。下邊做一下具體的內容採集規則。
經分析我們可以得知,內容在id為cntmain的區域內,標題id是articletit,店員疑因手機**死亡續:現場發現9發子彈
,所以標題我們可以這樣寫,注意,擷取的**要以檢視原始碼裡的格式為準.
內容這一塊是articlecnt,我們以artplink作為結束。內容的採集就是這樣了.
我們測試一下,是可以採到所有內容了,但是還有廣告和其它一些亂七八糟的**在裡邊,我們要過濾掉它。我看最上邊的分析**,廣告**,就那個推薦閱讀,id是reading,所以我們這樣過濾.
.看一下,沒有了,但要注意的一點是,這個還有個之前報道.請看圖,大多數的是不一樣的,比如有的是相關報道,有的是事件回放.有的只是鏈結.
我們發布到本地**dedecms5.3裡,所以模組選對應版本的,**管理目錄是http://dede53gbk/dede,所以按說明填寫上,然後是選定編碼,我們**gbk的,所以選gbk.然後是登陸**,使用火車內建瀏覽器登陸.如圖
然後就可以登陸成功後關閉火車瀏覽器了.下邊我們來重新整理列表,這個是用來指定將文章發布到哪個欄目的,如圖
可以看到是成功獲取到欄目了,然後我們測試配置
我們可以看到是成功發布了,**後台檢視一下,也是成功的,現在就可以儲存一下配置名,在發布時使用了.示例儲存為dedegbk53.
現在我們在任務發布設定那裡右鍵,
,選擇我們剛才的dedegbk53,然後再點一下選擇分類就可以指定將這個任務裡的文章發布到**的對應欄目了,我們可以新增多個配置,當然乙個配置也可以在多個任務裡被新增.
現在,我們所有配置都已經做好了,可以直接開始採集並發布了,儲存好任務後選中任務,點開始.
需要注意的是,這裡是可以不一次選的,採**,採內容,發內容可以分次進行,我們演示的一次全部完成.點開始,我們可以看到執行進度.
我們去**後台看一下效果,
蘋果cms火車頭發布模組
檔案 n459.com file 25127180 477253892 教程僅供參考,菜鳥 老鳥勿噴 1 新建發布模組 2 自動登入 登入 字尾 index.php?m admin check 登入post資料 表單名 m name 表單值 使用者名稱 表單名 m password 表單值 密碼 表...
如何使用火車頭採集器
而dz論壇使用的是uub格式,如 p 正文 p 所以在發布時要做乙個自動轉換。下面就是設定這個自動轉換功能。如果你的文章發布的dz門戶,就不需要轉換為ubb.1 開啟發布模組配置 2 以軟體裡自帶的discuz x 2.0論壇 為模板進行修改。我試過了可以正常住discuz x 2.5發布文章。3 ...
火車頭使用分頁採集有分頁的資料
分頁就是目標 上乙個文章分為好幾頁,我們需要設定規則將其全部採到。採集要點 1.採集規則要對每個分頁都適用。2.分頁規則如果是全部列出,只要第乙個頁面的分頁規則就可以了。如果是上下頁,每個頁面的分頁規則也要都適用。具體操作流程 先測試獲得所有分頁,再對每個分頁裡的內容進行獲取。下邊我們以為例來說明一...