今天尝试总结一下 tf.data 这个API的一些用法吧。之所以会用到这个API,是因为需要处理的数据量很大,而且数据均是分布式的存储在多台服务器上,所以没有办法采用传统的喂...
前言 这两天琢磨了下spark-deep-learning和spark-sklearn两个项目,但是感觉都不尽人如意。在training时,都需要把数据broadcast到各...
前言 写Optimizer系列文章,是因为去年2017年在华为做深度学习相关工作时,学习实现了许多基于tensorflow的optimizer的,开源了其中两个分布式的opt...
在大数据挖掘比赛中,除了模型的选择要到位,其特征工程的重要性也不言而喻,以至于大家经常会调侃,只要你的特征工程做得好,那你离冠军就不远了。 在特征工程中,特征选择是其中的重头...
sklearn、XGBoost、LightGBM的文档阅读小记 文章导航 目录 1.sklearn集成方法 1.1.bagging 1.1.1.基本思想 1.1.2.常见变体...
今天,在GitHub上偶然看到了Kailash Ahirwar作者的一个项目cheatsheets-ai,该项目包含了从不同渠道收集的数十张速查表,涉及到大数据分析、机器学习...
前言 上一篇我们对数据进行了读取并进行了可视化,今天我们来继续实现算法。 完整代码会在最后给出,如果你直接复制下面零散的代码可能会运行不了。 这篇的代码已经默认import了...
y值开始浮动了,那么loss现在是什么情况呢? 单输出loss,似乎看不出来。 在tensorboard中观察一下 看来基本面是向好的,权重开始学习到东西了。 在修改了Gra...
TensorFlow从0到1系列回顾 上一篇 9 “驱魔”之反向传播大法引出了反向传播算法——神经网络的引擎,并在最后窥探了它的全貌。本篇将详细的讨论反向传播各方面的细节。尽...