Hive 3 - UDF函数

Eclipse编写自定义UDF函数步骤

1、配置 pom

添加两个dependency

<dependency>
     <groupId>org.apache.hive</groupId>
     <artifactId>hive-exec</artifactId>
     <version>1.2.2</version>
</dependency>

<dependency>
     <groupId>org.apache.hive</groupId>
     <artifactId>hive-jdbc</artifactId>
     <version>1.2.2</version>
</dependency>
image.png

2、下载 hive-site.xml,放到 bin目录下,刷新maven项目

工程目录 右键 -> Maven -> Update Project

image.png

3、编写功能代码

image.png

4、打成Jar包,并上传到服务器(略)

image.png
image.png

5、在Hive中关联Jar,并创建临时函数 (3种方法)

5.1 本地临时函数

add jar local_path;

hive (db02)> add jar /opt/datas/udf_time.jar;
image.png

create temporary function 函数名 as ‘包名.类名';

hive (db02)> create temporary function mytime as 'com.bigdata.hive.HiveUdfTime';
image.png
5.2 HDFS临时函数

或者可以直接上传到HDFS上,

hive (db02)> dfs -put /opt/datas/udf_time.jar /;
image.png

create temporary function 函数名 as '包名.类名' using jar 'hdfs_path' ;

hive (db02)> create temporary function mytime1 as 'com.bigdata.hive.HiveUdfTime' using jar 'hdfs://hadoop06:8020/udf_time.jar';
image.png
5.3 永久函数

将Hive的jar添加到Hive的环境变量,并且编译Hive的源码

6、查看自定义函数

hive (db02)> show functions;

7、使用自定义函数

hive (db02)> select time_local,mytime1(time_local) newtimes from apachelog3;
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • hive.ddl.output.format:hive的ddl语句的输出格式,默认是text,纯文本,还有json...
    博弈史密斯阅读 6,025评论 0 6
  • Hive高级操作 1.使用LIKE、AS创建表,表重命名,添加、修改、删除列 表结构数据复制 根据已存在的表结构,...
    三万_chenbing阅读 4,785评论 0 2
  • 快乐大数据第5次课 hive(1)工作原理Hive的执行入口是Driver,执行的SQL语句首先提交到Drive驱...
    快乐大数据阅读 3,414评论 0 0
  • [TOC] 一、UDF 介绍 UDF(User-Defined Functions)即是用户自定义的hive函数。...
    w1992wishes阅读 8,739评论 0 0
  • 楔子 再小几岁的时候,听见别人说,如果你不爱我/不跟我在一起/离开我,我就去死,感觉:哇,好感动啊。 如果现在有人...
    独角兽reem阅读 3,613评论 0 0

友情链接更多精彩内容