首页 > 其他 > 详细

hive 自定义UDF

时间:2020-06-26 18:03:05      阅读:59      评论:0      收藏:0      [点我收藏+]

UDF  :user define function  用户自定义函数  一行输入,一行输出

定义Java类并实现org.apache.hadoop.hive.ql.exec.UDF——>覆写evaluate

需求: 将字符串类型的数据 2012-12-31 14:37:36  转换为  2012/12/31 

maven依赖:

 <dependency>
      <groupId>org.apache.hive</groupId>
      <artifactId>hive-exec</artifactId>
      <version>1.1.0</version>
    </dependency>

继承UDF类,重写evaluate函数

package com.cslc;
import org.apache.hadoop.hive.ql.exec.UDF;
public class testudf  extends  UDF{
    public static String evaluate(String time){

        String day=time.split("\t")[0];
        String result =day.substring(0,4)+"/"+day.substring(5,7)+"/"+day.substring(8,10);
        return  result;
    }

    public static void main(String[] args) {

        String date1=("2017-06-13 18:00:01");
        System.out.println(evaluate(date1));
    }
}

打包,上传至hdfs,给test库创建函数testdateudf

hadoop fs  -put  test.jar   hdfs://cslcdip/home/dip/

create function test.testdateudf  as  ‘com.cslc.testUDF‘  using jar  hdfs://cslcdip/home/dip/test.jar

这样就可以在test库里使用testdateudf函数了

 

hive 自定义UDF

原文:https://www.cnblogs.com/students/p/13195392.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!