
noSQL:抛弃事务处理
NewSQL: SQL+事务处理+SQL
云原生数据库:弹性

蓝色系统维度,红色技术维度
blockchain:数据防篡改
AI:数据库内做数据处理

类似于用电,不关心电来源,只关心想用就用。
只写日志,不写页面。
一写多读
云原生和分布式是正交关系。

多写云原生数据库还未有实现的


分布式事务处理:2pc+paxos
2pc:两阶段提交,举例:叫两个人吃饭,两个个人都同意,才吃饭;有一个不同意,取消。
分布式查询处理:让节点之间协同优化
分布式高可用:容错,多副本

分布式时钟:全局时钟递增

网络IO比磁盘IO更快,对磁盘和网络的优化


etl:extract,transform,load

对分析而言,列存储更合理,数据的压缩
数据分析是实时的,

多副本:data fresh问题

多主机

适合更新少,分析多的

AI4DB:数据的调优,经验可以学出来。
DB4AI:扩展SQL,使用SQL使用AI。


更详细的架构




SMP对称架构,DIE访问对应块(DRAM)很快,访问别的块就慢很多。

适合AP,并发计算,向量化执行,聚集算子。

内存数据库:充分利用内存,利用log防止数据丢失。假设数据能够全部加载到内存。(不使用2pc,使用原子锁)


减少事务的时延


















分布式为啥火?
1.满足实际应用
2.机会更多