Flume教程

Flume 数据流

Flume 是一个框架,用于将日志数据移动到 HDFS。通常事件和日志数据是由日志服务器生成的,这些服务器上运行着 Flume 代理。这些代理从数据生成器接收数据。
这些代理中的数据将由称为 收集器的中间节点收集。就像代理一样,Flume 中可以有多个收集器。
最后,来自所有这些收集器的数据将被聚合并推送到集中式存储,例如 HBase 或 HDFS。下图解释了 Flume 中的数据流。
Flume DataFlow

Multi-hop Flow

在 Flume 中,可以有多个代理,在到达最终目的地之前,一个事件可能会通过多个代理。这称为 multi-hop flow

Fan-out Flow

从一个源到多个通道的数据流称为 fan-out flow。它有两种类型-
Replicating-数据将在所有配置的通道中复制的数据流。 Multiplexing-数据将被发送到事件标题中提到的选定通道的数据流。

Fan-in Flow

将数据从多个源传输到一个通道的数据流称为 fan-in flow

Failure Handling

在 Flume 中,对于每个事件,都会发生两笔交易:一笔在发送方,一笔在接收方。发送方向接收方发送事件。收到数据后,接收方提交自己的事务,并向发送方发送"已接收"信号。发送方收到信号后提交其事务。(发送方在收到接收方的信号之前不会提交其事务。 )
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4