2.啟動監控資料夾命令touch flume-dir-hdfs.conf
vim flume-dir-hdfs.conf
a3.sources = r3
a3.sinks = k3
a3.channels = c3
# describe/configure the source
a3.sources.r3.type = spooldir
a3.sources.r3.spooldir = /opt/module/flume/upload
a3.sources.r3.filesuffix = .completed
a3.sources.r3.fileheader = true
a3.sources.r3.ignorepattern = ([^ ]*\.tmp)
# describe the sink
a3.sinks.k3.type = hdfs
a3.sinks.k3.hdfs.path = hdfs://hadoop102:9000/flume/upload/%y%m%d/%h
a3.sinks.k3.hdfs.fileprefix = upload-
a3.sinks.k3.hdfs.round = true
a3.sinks.k3.hdfs.roundvalue = 1
a3.sinks.k3.hdfs.roundunit = hour
a3.sinks.k3.hdfs.uselocaltimestamp = true
a3.sinks.k3.hdfs.batchsize = 100
a3.sinks.k3.hdfs.filetype = datastream
a3.sinks.k3.hdfs.rollinterval = 600
a3.sinks.k3.hdfs.rollsize = 134217700
a3.sinks.k3.hdfs.rollcount = 0
a3.sinks.k3.hdfs.minblockreplicas = 1
# use a channel which buffers events in memory
a3.channels.c3.type = memory
a3.channels.c3.capacity = 1000
a3.channels.c3.transactioncapacity = 100
# bind the source and sink to the channel
a3.sources.r3.channels = c3
a3.sinks.k3.channel = c3
3.向upload資料夾中新增檔案bin/flume-ng agent --conf conf/
--name a3 --conf-file job/flume-dir-hdfs.conf
在使用spooling directory source時,注意:
mkdir upload
touch hao.txt
touch hao.tmp
touch hao.log
ll 出現那三個檔案
04案例 實時讀取本地檔案
實時讀取本地檔案到hdfs案例 案例需求 實時監控hive日誌,並上傳到hdfs中 1.flume想要將資料輸出到hdfs,必須持有hadoop相關jar包將commons configuration 1.6.jar hadoop auth 2.7.2.jar hadoop common 2.7.2...
6 案例 人臉案例
1 得到影象的特徵後,訓練乙個決策樹構建的adaboost級聯決策器來識別是否為人臉 2 opencv中自帶已訓練好的檢測器,包括面部,眼睛,貓臉等,都儲存在xml檔案中,我們可以通過以下程式找到他們 主程式如下 import cv2 as cv import matplotlib.pyplot a...
銀行 信用風險,即客戶違約風險,是銀行風險管控的主要內容。不同行業,不同企業,財務指標的風險程度不同。假資料,假資訊,假報表的現象,財務資訊的質量問題有三個方面是非常重要的 1.建立識別假報表的管理體系 2.研究建立財務資訊的勾稽關係,即通過相互之間的購機關係的檢驗來判別資料的質量 3.建立資料的錄...