写在前面:感谢GeekBand提供这样好的学习机会,让我在繁忙的工作之余可以学习巩固c++知识。以下是边学边记的一些扩展点。分享给大家。
Concurrency
进程与线程 (Thread VS Process)(http://www.jianshu.com/p/177e9b073ce8)
程序在操作系统运行的基本单位,提高应用的并发性。程序拥有至少一个进程,一个进程至少有一个线程。多线程程序,并发性比较高;进程执行时候有独立的内存单位,而线程可以共享内存以提高效率。每个独立的线程有个程序运行的入口,数据执行的序列和程序的出口;操作系统中对进程的调度分配来达到资源管理的目的,进程是系统进行资源分配的独立单位。
**生产者与消费(Consumer and Producer ) **
操作系统的有限和缓存的问题,多线程同步问题的案例。生产者线程生产数据放入缓冲区,同时消费者从缓冲区中消耗数据。问题的关键在于如何使得:生产者不在缓冲区满的时候加入数据,消费者不在缓冲区空的时候消耗数据。
生产者与消费的经典应用: Blocking Queue (Java实现)
Tracking:
同步(Synchronized )
异步(Asynchronized ):建立缓冲区
Network
Application Layer : HTML 1.0 VS HTML 1.1: 后者支持虚拟主机和断点续传
Presentation Layer: TCP VS UDP:前者连接可靠,后者效率高
问题:当浏览器输入URL并且按下回车键之后会发生什么?
找IP地址:先URL 缓存 ,然后DNS
得到返回IP地址
本地计算机和服务器通过IP建立TCP连接(三次握手),默认80端口
浏览器和服务器建立HTTP会话(Session),接受数据
浏览器解析数据并在浏览器中渲染出来
浏览器关闭时,终止会话。
Database
Relational DV VS KeyValue Store
前者典型例子:银行存钱系统,需要实时;
后者典型例子:社交网站,简单,量大
Sharding VS Clustering直接拆分与负载智能管理
关于Tiny URL 问题:为URL存储短URLCode映射成URL(Tiny URL Service ),需要保存成下面的格式:
code:varchar(8)
URL:varchar(1000)
createed_at: timestamp
还需要能够反向将URL映射成code
需要给URL和Code加索引,一遍可以反向将URL映射成Code
Distribute System
关于Tiny URL 问题: 如何规模化Tiny URL Service
负载均衡和无状态的前置服务器
分片,备份的数据库(备份大量的short link code)
交互需要加缓存,减轻服务器压力
根据分好的片定位到数据库相应的区间,缓解写的压力
本地缓存事件追踪聚合+异步刷新到高吞吐(high-throughput)的信息队列中
使用产生的唯一ID生成器,支持64位
Performance
问题: 全世界有多少钢琴调音师(逻辑推理,估算能力)
流程:全世界人口总数和家庭个数;
估计大概10~20%家庭会有钢琴,得出钢琴个数;
每个钢琴调音师大约每个月工作4-5次;
最后得出有多少钢琴调音师可以满足这些需求。
关于Tiny URL问题: 我们也可以估算总体存储量是多少。
因为URL长度是10-1000字符(byte),取平均值是200 byte;
计算总共需要URL的数量:
假设我们已经拥有100M个URL,新的URL注册的数量是100,000/天(每秒一个)
那么一年的URL的条数就是100,000 x 365 条,即36,500,000 byte,
如果一天查询100M次,那么每秒查询就是1000次。
发现:读的数量远大于写的数量,可能需要做缓存,读写分离。
Design Pattern
MVC:连接模型到某个前端;
Singleton:保证只有一个实例,比全局变量靠谱。可以随时直接更改;
Factory:定义创建对象的接口,让接口决定实例化哪个类。用于生成各种子类的时候;
Iterator:顺序访问集合中的元素,同时不会暴露集合中的元素。需要保证插入和删除不会影响到其他对象;
Decorator:用一个新的类,对对象新增附加方法,指向基类的指针,调用时用多态调用就可以了;
Facade:提供一致的界面,提供一致的接口。