首页 > 其他 > 详细

Hadoop_UDF示例

时间:2016-11-24 11:31:58      阅读:283      评论:0      收藏:0      [点我收藏+]

UDF:  一进一出

Eclipse端
  1. 继承UDF
  2. 实现evaluate方法(可重裁实现多个evaluate方法,以实现不同需求)
  3. 导出类jar包,注意指定main方法
Hive端
  1. 将jar包添加到Hive: add jar linux_path # 0.14版才开始支持
  2. 创建临时函数: create [temporary] function [if not exists] f_name classpath
     删除临时函数: drop [temporary] function [if exists] f_name 

简单示例,去除某一列双引号

package com.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class RMQuotes extends UDF{

  public Text evaluate(Text str){
	if(str != null){
	  return new Text(str.toString().replaceAll("\"", ""));
	}else return null;
  }
  public static void main(String[] args) {
	System.out.println(new RMQuotes().evaluate(new Text("\"hbhb\" \"GET /SSS/DDD/FFF?id=8 HTTP/1.1\"")));
  }
}

Hadoop_UDF示例

原文:http://www.cnblogs.com/eRrsr/p/6096896.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!