1.概述 Spark SQL 是一层依赖Spark Core也就是基础操作的API封装出的一层组件. 和GraphX类似, 它的核心思想是解决两...
Abstract 昨天丢人现眼的写QuickSort用了40分钟, 当时感觉整个人都不好了.(╯°□°)╯︵┻━┻ 看孩子一天睡4小时大脑不...
1. 分布式一致性 分布式一致性大体上意味着, 在多个分散的机器上, 如何保证状态(key value tuple)是完全一致的. HDFS非常...
论文地址 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.104.2585&r...
我们在阿联酋的机房采用了这种设计模式, 就像前面Federated Identify中聊到的, 对于超高价值数据. 一般使用专用系统来处理. ...
这个也可以不用解释了, 当前所有的云服务都是集中授权, 跨域授权的OAuth模式.坏处是多次IO的代价, 复杂的token权限管理, 以及所有服...
这个模式就不再概述了, 当前绝大部分公司的设计思路都是一句话服务是无状态的一个跑在docker内部的服务最好是无状态的, 非常类似于函数式编程的...
利用一个只能append的数据库(hive这种) 来存储所有的action, 认为这些action是按照时间序列进来的, 并且不会改变. 通过...
非常著名的设计模式, 把数据读取和数据写入过程相分离, 来拉升整个系统的性能. 同时也能避免多线程update时的冲突 问题 一般我们做数据统...