目录
Apache Hadoop生态-目录汇总-持续更新
系统环境:centos7
Java环境:Java8
案例只演示通道流程,其中Source,channel,Sink的种类按需调整

1:案例流程描述
使用 Flume-1 监控文件变动,Flume-1 将变动内容传递给 Flume-2,Flume-2 负责存储到 HDFS。
同时 Flume-1 将变动内容传递给 Flume-3,Flume-3 负责输出到 LocalFileSystem。
架构流程如下:Flume1同时发送给Flume2,Flume3

2:实现步骤:
2.1:实现flume1.conf
配置1个接收日志文件的 source 和两个 channel、两个 sink,分别输送给flum2和 flume3
vim flume1.conf
# 1:定义组件
a1.sources = r1
a1.sinks = k1 k2
a1.channels = c1 c2
# 2:定义source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /logs/hive.log
a1.sources.r1.shell = /bin/bash -c
# 将数据流复制给所有 channel - 默认replicating
a1.sources.r1.selector.type = replicating
# 3:定义channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a

本文介绍了在Apache Hadoop生态中,使用Flume进行数据复制和多路复用的案例。通过配置flume1.conf、flume2_hdfs.conf和flume3_dir.conf,Flume1监控文件变动,将内容同时传输给Flume2(存储到HDFS)和Flume3(输出到LocalFileSystem)。详细步骤包括Flume1的双通道配置,Flume2和Flume3的source设置。
519

被折叠的 条评论
为什么被折叠?



