頻道指令碼是頻道配置中的指令碼, 如果配置了頻道指令碼,該頻道的所有採集流程將被配置的指令碼所接管。
一.可用全域性物件(唯讀)
extract:當前採集引擎[ 物件型別: extractor ]
datadb:當前連線的資料庫[ 物件型別: database ]
result:當前結果集物件[ 物件型別: result ]
二.this指標
當前頻道節點[channel ]物件
三.指令碼返回值
無示例一:
用指令碼建立乙個採集源列表
1.以下指令碼將生成
url u;
for(i=1;i <=31;i++)
url u;
time t1;
for(i=0;i<10;i++)
2.以下指令碼從伺服器請求json資料並存入到記錄中gdoc = extract.opendoc(this,"",0);url u;
var keys=["前嗅","爬蟲"];
for(i=0;i
示例二:用指令碼採集資料
1.以下指令碼查詢**並抽取**資料
gdoc = extract.opendoc(this,"",0);
if(gdoc)
if(corp)
if(fund)
result.addrec(rec,3);
}
tr = tr.next; }
}
}
extract.closedoc(gdoc);
}
if(gdoc)
extract.closedoc(gdoc);
}
python指令碼前兩行
1.第一行指定直譯器路徑 usr bin env python 詳細說明 usr bin python是告訴作業系統執行這個指令碼的時候,呼叫 usr bin下的python直譯器 usr bin env python這種用法是為了防止使用者沒有將python裝在預設的 usr bin路徑裡。當系統...
python指令碼的前2行注釋
usr bin python coding latin 1 import os,sys 解釋 第一行的路徑是指定執行指令碼的直譯器的位置 實際使用中 1.使用 which python3找到對應路徑。比如 which python3 library frameworks python.framewo...
shell指令碼刪除7天前的日誌
1.刪除檔案命令 find 對應目錄 mtime 天數 name 檔名 exec rm rf 例項 find opt soft log mtime 7 name log exec rm rf 說明 將 opt soft log 目錄下所有7天前帶 log 的檔案刪除 2.建立shell touch ...