h2o的使用

h2o 一个简单方便的建模工具,提供多种接入方式.java ,python等客户端.还有一个h2o-flow的可视化界面.总结下使用的历程,希望有更多的人使用起来.

h2o-flow

下载地址: https://www.h2o.ai/download/

  • 使用界面如下,类似于zeppelin的使用风格.
  • java -jar h2o.jar [各种参数] ,内置了jetty服务,直接用java -jar就可以启动.然后访问端口为54321.
  • flow的方式不能对数据做处理,需要将数据提前处理好.
  • 对中文的支持不是很好.显示乱码.主要是中文是双字节的,h2o有自己的数据结构(hex).hex是对单字节的处理.修改下源码即可.
  • h2o可以直接读取hdfs (hdfs://.......),本地等数据.对于文件格式的支持有text,csv,parquet等.orc的格式需要以hadoop集群的方式启动,才能使用.
  • 对parquet格式的支持有timestamp int96的问题.这个问题主要是parquet项目中timestamp使用的类型是int96造成的.spark,drill等项目也会遇到这个问题.但是都各自解决掉了.参照spark的修改方式.也可以修改.
  • h2o集群的部署,有三种部署方式,一种是jvm进程组建standalone集群.另外两种借助hadoop实现分布式集群.
  • standalone集群方式中,没有HA,其中一台坏掉了这个集群就坏掉了.
  • standalone集群也会有通信问题,在不使用多长时间后这个集群会因为监听心态通信不成功而down掉.(这个问题没有解决),可能是ipv6的问题.
  • 使用方式很简单,按照notebook的方式引用数据,选择模型类型.很快就能看到各个模型的指标了.
  • h2o 中文社区我是没有找到.整个社区也不是很活跃.
image.png

h2o-python

python 客户端的使用方式, 需要安装 python 的h2o的客户端.可以在官网找到.

  • 如何使用python客户端连接 h2o server服务器的话,必须主要版本号必须一致.小版本号也好一致.否则会有问题. h2o.connect("localhost")
  • 如果使用的是python自己启动的实例就没有这样的问题. h2o.init()
  • python 可以有些数据处理的动作,然后在模型部署前,将python文件和模型一起打包完成线上模型的部署.


    image.png

线上部署模型

上面两种方式最终都可以导出pojo或者mojo文件.将这个文件使用steam(h2o 的一个工具)可以打包成war.然后部署在容器中.完成线上部署.

总结

h2o快速建模,快速部署模型的方式大大缩减了开发模型到上线部署的时间周期.对于有java 和python语言基础的人员来说上手速度快.
由于社区不是很活跃,对于一些水土不服的功能,需要各自修改,增添功能.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342