H2O操作记录 分布式随机森林

数据集下载

数据集可以从这个网址进行下载:https://s3.amazonaws.com/h2o-public-test-data/smalldata/flow_examples/ad.data.gz

数据集导入

2018-05-08-11-26-41.jpg

数据集解析

2018-05-08-11-28-26.jpg

点击Parse

2018-05-08-11-29-02.jpg

点击View查看数据集

2018-05-08-11-30-32.jpg

点击最后一列,查看标签列的分布情况。

模型构建

选择分布式随机森林算法:

2018-05-08-11-31-28.jpg

参数界面截图:

2018-05-08-11-35-16.jpg

2018-05-08-11-35-38.jpg

2018-05-08-11-36-04.jpg

2018-05-08-11-36-28.jpg

该算法比较重要的参数是下面这个截图:

2018-05-08-11-37-32.jpg

点击“构建”:

2018-05-08-11-38-07.jpg

模型结果

2018-05-08-11-38-52.jpg

XGBoost差不多,但是这个可以下载POJOXGBoost好像不能下载。

2018-05-08-11-39-38.jpg

2018-05-08-11-39-56.jpg

2018-05-08-11-41-02.jpg
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容