240 发简信
IP属地:香港
  • Resize,w 360,h 240
    1 Spark SQL 简介

    1.概述 Spark SQL 是一层依赖Spark Core也就是基础操作的API封装出的一层组件. 和GraphX类似, 它的核心思想是解决两...

  • Resize,w 360,h 240
    Spark是如何实现排序的?

    Abstract 昨天丢人现眼的写QuickSort用了40分钟, 当时感觉整个人都不好了.(╯°□°)╯︵┻━┻ 看孩子一天睡4小时大脑不...

  • Resize,w 360,h 240
    Zab vs Paxos

    1. 分布式一致性 分布式一致性大体上意味着, 在多个分散的机器上, 如何保证状态(key value tuple)是完全一致的. HDFS非常...

  • Resize,w 360,h 240
    如何在上亿张图片中找到相同的图片

    论文地址 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.104.2585&r...

  • 门卫模式 Gatekeeper Pattern

    我们在阿联酋的机房采用了这种设计模式, 就像前面Federated Identify中聊到的, 对于超高价值数据. 一般使用专用系统来处理. ...

  • Resize,w 360,h 240
    跨域授权 Federated Identity Pattern

    这个也可以不用解释了, 当前所有的云服务都是集中授权, 跨域授权的OAuth模式.坏处是多次IO的代价, 复杂的token权限管理, 以及所有服...

  • 配置分离模式 External Configuration Store Pattern

    这个模式就不再概述了, 当前绝大部分公司的设计思路都是一句话服务是无状态的一个跑在docker内部的服务最好是无状态的, 非常类似于函数式编程的...

  • Resize,w 360,h 240
    操作日志模式 Event Sourcing Pattern

    利用一个只能append的数据库(hive这种) 来存储所有的action, 认为这些action是按照时间序列进来的, 并且不会改变. 通过...

  • 命令查询职责分离模式 Command and Query Responsibility Segregation (CQRS) Pattern

    非常著名的设计模式, 把数据读取和数据写入过程相分离, 来拉升整个系统的性能. 同时也能避免多线程update时的冲突 问题 一般我们做数据统...

个人介绍
shadowinlife@gmail.com
漫画爱好者
视频通关wow副本