H2O Sparkling Water

什么是H2O Sparkling Water

Sparkling Water允许用户将快速,可扩展的H2O机器学习算法与Spark的功能相结合。 使用Sparkling Water,用户可以从Scala / R / Python驱动计算并利用H2O Flow UI,为应用程序开发人员提供理想的机器学习平台。

Spark是一个优雅而强大的通用,开源,内存平台,具有巨大的动力。 H2O是一种用于机器学习的内存应用程序,它正在重塑人们如何将数学和预测分析应用于他们的业务问题。

集成这两个开源环境为想要使用Spark SQL进行查询的用户提供了无缝体验,将结果提供给H2O以构建模型并进行预测,然后在Spark中再次使用结果。 对于任何给定的问题,工具之间更好的互操作性提供了更好的体验。

如何安装

https://www.h2o.ai/download/

这里介绍在R里面的安装:

  1. Download and unpack Sparkling Water distribution
cd ~/Downloads
unzip sparkling-water-2.3.15.zip
cd sparkling-water-2.3.15
  1. Install RSparkling dependency, SparklyR:
install.packages("sparklyr")
  1. Install Spark:
library(sparklyr)
spark_install(version = "2.3.2")
  1. Install H2O of correct version:
install.packages("h2o", type = "source", repos = "https://h2o-release.s3.amazonaws.com/h2o/rel-wright/9/R")
  1. Finally, install RSparkling

Install latest version from CRAN:

install.packages("rsparkling")

install latest version from the downloaded distribution.

# rsparkling_0.2.10.tar.gz is available at the downloaded distribution. 
install.packages("rsparkling_0.2.10.tar.gz", repos=NULL, type="source")
  1. Set Sparkling Water version to be used with RSparkling
options(rsparkling.sparklingwater.version = "2.3.15")
library(rsparkling)
  1. Connect to Spark
sc <- spark_connect(master = "local", version = "2.3.2")
  1. Now, H2OContext is available and we can use any H2O features available in R.
h2o_context(sc)
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 介绍 人工智能......在这一点上,你知道这是未来的潮流,如果你把它添加到你的职业技能列表中并且最终会杀死我们所...
    Liam_ml阅读 12,269评论 0 12
  • H2O.ai by sennchi Predictive Analytics And Machine Lea...
    sennchi阅读 4,444评论 0 1
  • AI 开发工具总结机器学习工具开发工具包:机器学习的开源工具深度学习工具github 上一些工具: 参考 机器学习...
    风火布衣阅读 7,893评论 1 2
  • [TOC] 一、运行环境要求 1、操作系统: Windows 7或更高版本OS X 10.9或更高版本Ubuntu...
    godvan阅读 5,211评论 0 0
  • 首先,你需要下载R,下载python,之后还需要加载java。然后你可以在R中使用install.packages...
    Liam_ml阅读 4,733评论 0 0