如何在Win10系统使用Python3连接Hive

站长资源 2024/12/25 佚名

2 0 1

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。

我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。

第一步：安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示：若是无法安装，也可以点击如下网址，

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载，然后进行本地化安装。

第二步：安装impyla库

我采用本地化安装方式，先下载impyla库的whl，如下图：

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示：上面的绝对路径根据你自己的情况而定

第三步：测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过，表示利用impala连接Hive配置成功。

简单示例：

从Hive的一张表读取100条记录，放到pandas的DataFrame里面。

参考代码：

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容，更多关于Python3连接Hive的资料请关注其它相关文章！

Python,连接Hive,win10,连接Hive

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“如何在Win10系统使用Python3连接Hive”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

更新日志

2024年12月25日

如何在Win10系统使用Python3连接Hive

如何使用Python自动生成报表并以邮件发送

Python进行特征提取的示例代码

评论“如何在Win10系统使用Python3连接Hive”

更新日志

友情链接