DeDeCMS織夢後台自帶採集器採集教程案例分享

2022-10-11 08:36:12 字數 1548 閱讀 2675

前面幾篇文件,我們介紹了織夢自帶採集器使用教程,但是不是每個使用者都可以用都好,總之採集這個東西要實站積累經驗才行,因為目標站**不同,只有碰到不同的問題積累起來才能上手操作。

檢視採集站點的編碼和**原始碼

選擇採集站點的編碼

我們檢視採集站點的列表頁原始碼,找到文章列表開始html和結束html標籤,分別把它們複製到增加採集節點->文章**匹配規則的"區域開始的html"和「區域結束的html」輸入框中。你不一定選擇右鍵檢視原始碼來找到文章列表開始標籤,你可以在文章開始的地方右鍵單擊,審查元素(chrome瀏覽器,firefox是檢視元素),這樣就更方便的找到文章列表開始和結束的標籤了。

設定之後我們點選"儲存資訊並進入下一步設定"

設定完畢,我們點選"儲存配置並預覽"

在第七步中的匹配規則後面,都 有乙個過濾規則,這個過濾規則是用來過濾無需採集的內容。

比如,網易每篇文章都有乙個放置廣告的iframe標籤,我們要採集網易的文章,不可能採集回來之後,一篇一篇得去刪除這個廣告。但是如何去除呢?去除方法就是那個過濾規則,我們點選常用規則,就會彈出乙個小視窗,列出了常用的過濾規則,我們只需點選要們要過濾的規則即可,要過濾網易文章中的iframe標籤,我們就點選iframe即可。

測試內容字段設定

因為網易有的文章開頭是,有的文章開頭是,所以會出現採集出錯的情況。

如果你現在就要採集,你可以點選儲存並採集。這裡我選擇僅儲存

採集內容(一)

回到採集節點管理的介面,也就是第一步中的介面,我們選擇節點,點選採集

採集內容(二)

匯出內容

選擇要匯入到的欄目,資料量,是否生成html檔案 ,隨機推薦數量

最終結果

織夢修改「Dedecms提示資訊」,及後台版權

這幾天剛好在鼓搗織夢的程式,然後其實如果真的用於運營並且獲取商業授權之後,很多站長第一時間想到的還是去除織夢的各種版權,我就整理幾個比較明顯的地方進行修改或者去除的教程。不過各位織夢的切記,畢竟這個程式仍然是相當棒的勞動成果,前後台留一些版權給織夢還是有必要的。修改 dedecms提示資訊 1.第乙...

織夢dedeCMS去除後台更新提示資訊教程

織夢後台更新好文章提示 dedecms提示資訊!這到底怎麼改呢,我最近找了很多文章教程還沒解決,今天我終於解決了,下面是我的解決辦法 第一 先找到織夢根目錄下的include common.func.php這個檔案。找到function showmsg 可以發現有兩處dedecms提示資訊,進行想對...

dedecms 織夢 整合discuz

所用版本 dedecms 5.7 discuz x2.5 sc utf8 如何完成dedecms模板系統與discuz論壇整合呢?這裡的整合指會員資訊,會員登陸 退出的同步 論壇資訊的引用 等等。首先,我們先來安裝織夢 dedecms 系統。然後,我們在 根目錄下建乙個bbs資料夾,將discuz ...