h2o steam

steam工具主要包括两个功能

  • war的生成
  • 服务的管理

war的生成

h2o主要是java 开发,最终的模型文件也是一个java文件,所以模型上线的方式是以服务的方式.可以部署在tomcat,jetty等容器中.
当然模型的java文件也可以嵌入到自己的项目中,实现stream方式的线上打分.比如放到flink或者storm中.

  • war的生成需要启动另外一个服务(打包服务),在下载的文件中有一个ROOT.war的文件.这个打包的war部署在容器中,默认端口是55000,服务界面如下,注意到左侧是可以上传预处理逻辑的python文件或者java文件.右侧中的pojo文件和h2o jar,是必须的,pojo是你离线训练的模型.h2o jar 中在你官网下载的文件包中就存在的.


    image.png
  • 以为一种就是不使用web界面,而是命令行的方式.需要的参数和web界面上看到的一样.
curl -X POST \
--form pojo=@gbm_cf6fdeef_cad1_4e85_b644_6358166076ca.java \
--form jar=@lib/h2o-genmodel.jar \
--form prejar=@pre.jar \
--form preclass=PreProcess \
localhost:55000/makewar > example.war

服务的管理

由于协议问题,服务稳定性问题等等,建议不使用steam的服务管理.通过编写docker file 完成自动的docker 容器部署方式实现ha ,负载等

问题

生成的war包没有日志的输出,每次需要自己将log4j配置进去.通过看源码增加上了日志的输出.
1,git clone https://github.com/h2oai/steam
2,cd prediction-service-builder
3,增加 log4j.jar 和 slf4j-log4j12.jar到lib文件夹中,如下图
4,在WEB-INF中增加log4j.property的配置文件

image.png

5,./gradlew build 打包生成ROOT.war文件.

总结

使用起来比较方便,通过HttpServlet的方式将模型发布成restful 接口的形式.将预处理逻辑和模型巧妙的结合在一起.提供一个完整的在线打分模式.
使用python做预处理的使用,由于是python进程和jvm进程两个进程,需要过多的socket通信(服务启动后,会通过ProcessBuilder 新建一个python的子进程.),对于时效性要求比较高的场景,直接使用java做预处理比较好.

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 46,971评论 6 342
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,991评论 19 139
  • 在应用程序中添加日志记录总的来说基于三个目的:监视代码中变量的变化情况,周期性的记录到文件中供其他应用进行统计分析...
    时待吾阅读 5,030评论 0 6
  • 在应用程序中添加日志记录总的来说基于三个目的:监视代码中变量的变化情况,周期性的记录到文件中供其他应用进行统计分析...
    时待吾阅读 5,084评论 1 13
  • 又是这样平淡无奇的一天,丈夫踏着些许沉重的脚步回到家,目光落在在厨房忙碌的妻子,不自觉地蹙了一下眉头。一会儿的...
    瑛落阅读 277评论 1 0