Python连接hive库

一、下载hive提供的依赖包
将hive安装包下的lib/py中的文件拷贝到python的sys.path中的site_packages目录下,否则引用对应的包会报错,这个是使用hive提供的Python接口来调用hive客户端。

001.png

二、安装pyhs2
控制台执行命令:pip install pyhs2
如果安装不成功,安装上面提到的依赖包就可以了。

pyhs2.png

三、启动hive 的thrift
确保以下服务开启,默认端口是10000:
hive --service hiveserver

四、代码演示

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import pyhs2

with pyhs2.connect(host='10.104.111.33',
                   port=10000,
                   authMechanism="PLAIN",
                   user='bestfei',
                   password='password',
                   database='default') as conn:
    with conn.cursor() as cur:
        #Show databases
        print "cur.getDatabases"
        print cur.getDatabases()
        print "-"*40
        
        #Execute query
        cur.execute("show databases")
        #Return column info from query
        print cur.getSchema()
        print "-"*40
        #Fetch table results
        for i in cur.fetch():
            print i
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容