Hive 3 - UDF函数

Eclipse编写自定义UDF函数步骤

1、配置 pom

添加两个dependency

<dependency>
     <groupId>org.apache.hive</groupId>
     <artifactId>hive-exec</artifactId>
     <version>1.2.2</version>
</dependency>

<dependency>
     <groupId>org.apache.hive</groupId>
     <artifactId>hive-jdbc</artifactId>
     <version>1.2.2</version>
</dependency>
image.png

2、下载 hive-site.xml,放到 bin目录下,刷新maven项目

工程目录 右键 -> Maven -> Update Project

image.png

3、编写功能代码

image.png

4、打成Jar包,并上传到服务器(略)

image.png
image.png

5、在Hive中关联Jar,并创建临时函数 (3种方法)

5.1 本地临时函数

add jar local_path;

hive (db02)> add jar /opt/datas/udf_time.jar;
image.png

create temporary function 函数名 as ‘包名.类名';

hive (db02)> create temporary function mytime as 'com.bigdata.hive.HiveUdfTime';
image.png
5.2 HDFS临时函数

或者可以直接上传到HDFS上,

hive (db02)> dfs -put /opt/datas/udf_time.jar /;
image.png

create temporary function 函数名 as '包名.类名' using jar 'hdfs_path' ;

hive (db02)> create temporary function mytime1 as 'com.bigdata.hive.HiveUdfTime' using jar 'hdfs://hadoop06:8020/udf_time.jar';
image.png
5.3 永久函数

将Hive的jar添加到Hive的环境变量,并且编译Hive的源码

6、查看自定义函数

hive (db02)> show functions;

7、使用自定义函数

hive (db02)> select time_local,mytime1(time_local) newtimes from apachelog3;
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容