首页 > Web开发 > 详细

Flume lzo压缩输出至 hadoop

时间:2015-02-02 19:46:12      阅读:470      评论:0      收藏:0      [点我收藏+]

 

1. Hadoop 支持lzo压缩依赖:  

lzo:Unix/linux系统默认没有lzo的 库,因此需要安装,sudo yum install lzo-devel.x86_64 

       sudo yum install lzo.x86_64          sudo yum install lzop.x86_64

 

2. 准备maven,ant,gcc 等

3. 编译hadoop-lzo

  从https://github.com/twitter/hadoop-lzo 下载,解压进入目录, mvn clean package

 在 target 下 hadoop-lzo-0.4.20-SNAPSHOT.jar    target/native/Linux-amd64-64/lib 下有 libgplcompression 库

 jar包拷贝到hadoop lib目录下, gplcompression库拷贝到lib/native/Linux-amd64-64/lib下

  在hadoop客户端或者各个节点,不需要都安装lzo库,可以直接把lzo库拷贝到 hadoop 下的 lib/native/Linux-amd64-64/lib下

  

总结:编译hadoop-lzo ,lzo-devl库同样不能少。

 

4. 修改hadoop 客户端配置文件(我们只需要在使用flume的机器上配置)

   http://heylinux.com/archives/2078.html

 

Flume lzo压缩输出至 hadoop

原文:http://www.cnblogs.com/kuipertan/p/4268455.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!