首页 > Web开发 > 详细

Flume协作框架

时间:2016-11-25 12:17:29      阅读:320      评论:0      收藏:0      [点我收藏+]

1.概述  

  -》flume的三大功能
    collecting, aggregating, and moving
      收集 聚合 移动

 

2.框图

  技术分享


3.架构特点
  -》on streaming data flows
    基于流式的数据
    数据流:job-》不断获取数据
    任务流:job1->job2->job3&job4


  -》for online analytic application.


  -》Flume仅仅运行在linux环境下
    如果我的日志服务器是Windows?


  -》非常简单
    写一个配置文件,运行这个配置文件
    source、channel、sink


  -》实时架构
    flume+kafka spark/storm impala


  -》agent三大部分
    -》source:采集数据,并发送给channel

    -》channel:管道,用于连接source和sink的
    -》sink:发送数据,用于采集channel中的数据

 

4.Event

  技术分享

 

5.Source/Channel/Sink

  技术分享

二:配置

1.下载解压

  下载的是Flume版本1.5.0

  技术分享

 

2.启用flume-env.sh

  技术分享

 

3.修改flume-env.sh

  技术分享

 

4.增加HADOOP_HOME

  因为在env.sh中没有配置,选择的方式是将hdfs的配置放到conf目录下。

  技术分享

 

5.放入jar包

  技术分享

 

6.验证

  技术分享

 

7.用法

  技术分享

 

8.

  

 

Flume协作框架

原文:http://www.cnblogs.com/juncaoit/p/6100744.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!