20 大資料學習之旅 flume安裝和配置

實現步驟：

安裝jdk，1.6版本以上

上傳flume的安裝包

解壓安裝

在conf目錄下，建立乙個配置檔案，比如：template.conf（名字可以不固定,字尾也可以不固定）

#配置agent a1 的元件
a1.sources=r1
a1.channels=c1 (可以配置多個，以空格隔開，名字自己定）
a1.sinks=s1 (可以配置多個，以空格隔開，名字自己定）
#描述/配置a1的r1
a1.sources.r1.type=netcat (netcat表示通過指定埠來訪問)
a1.sources.r1.bind=0.0.0.0 (表示本機)
a1.sources.r1.port=44444 （指定的埠，此埠不固定，但是不要起衝突）
#描述a1的s1
a1.sinks.s1.type=logger (表示資料匯聚點的型別是logger日誌）
#描述a1的c1
a1.channels.c1.type=memory
a1.channels.c1.capacity=1000
a1.channels.c1.transactioncapacity=100
#位channel 繫結 source和sink
a1.sources.r1.channels=c1 （乙個source是可以對應多個通道的）
a1.sinks.s1.channel=c1 (乙個sink,只能對應乙個通道）

6.根據指定的配置檔案，來啟動flume

進入flume的bin目錄

執行：./flume-ng agent -n a1 -c ../conf -f ../conf/template.conf -dflume.root.logger=info,console

如果出現上圖所示，證明配置和啟動成功

7.通過nc來訪問：

nc localhost 44444

hello flume

或者：通過外部http請求訪問對應的ip和埠

比如：啟動命令解釋

20 大資料 hive資料格式

hive支援原子和複雜資料型別。原子資料型別包括數值型布林型字串型別和時間戳型別。複雜資料型別包括陣列對映和結構 hive會為每個建立的資料庫在hdfs上建立乙個目錄，該資料庫的表會以子目錄形式儲存，表中的資料會以表目錄下的檔案形式儲存。對於default資料庫，預設的預設資料庫沒有自己的目錄...

大資料學習之路53 flume使用示例

因為flume是面對各種場景的，所以當我們面對具體場景的時候，我們需要提供一套配置檔案。告訴他source用哪一種，channel用哪一種，sink用哪一種。我們知道source用哪一種之後還要告訴他檔案在 sink也是，比如我們要往hdfs中存，我們要告訴他實現類用hdfs，接著hdfs的實現類需...

大資料的學習總結（2）大資料基礎知識

現在全球資料量以每年60 的速度增長，預計2020年，資料量將進入zb時代。而大資料的應用又十分的廣泛，無論是在學術研究生產實踐公司戰略國家治理等各個方面都具有非同尋常的意義。因此對大資料的學習和研究是必不可少的。大資料的核心目標利用好資料實現大資料的高效儲存管理和值的挖掘分析大資料三層...

20 大資料學習之旅 flume安裝和配置

20 大資料 hive資料格式

大資料學習之路53 flume使用示例

大資料的學習總結（2） 大資料基礎知識

相關推薦

大資料的學習總結（2）大資料基礎知識