1 configuration api Hadoop 组件的配置使用 XML 形式的配置文件,并且可以使用 ${变量名} 的形式来使用其他属性的...
hadoop 的数据完整性 数据存储或 IO 时可能损坏,需要使用校验和来检查数据完整性(校验和当然也会出错,但是由于校验和数据量很低,所以出错...
本部分主要是关于 YARN。Yarn 是在 hadoop 2 中引入的资源管理系统。用户代码并不会与其直接交互,但是许多分布式计算框架都是作为一...
广告网络允许广告主按照已经定义好的用户划分来购买广告,但是需求方还有进行流量的自主选择以及为每次展示独立出价的需求。要满足这种需求,需要询价、出...
当数据量很大,一台物理机无法容纳时,我们就需要将数据存储到由网络连接的若干台机器上,这就是所谓的分布式文件系统。hadoop 使用 hdfs 作...
map-reduce 是 hadoop 的核心概念之一,hadoop 权威指南中以一个天气数据处理的例子说明了 map-reduce 的好处: ...
竞价广告的策略很简单,用四个字总结为:价高者得。在竞价广告中,搜索广告是较为重要的一种,很多竞价广告的概念和技术都源自于搜索广告。广告网络(AD...
合约广告的重点是按照 CPM 计费的展示量合约广告,按照广告位+人群进行售卖。 1 广告位合约 最简单的广告位合约即按照 CPT 的计费方式独占...
本章共分为三个部分: 广告有效性原理,将广告分为若干阶段,评估其影响因素。 计算广告的核心问题,即优化收入部分,eCPM(每千次广告期望收入) ...