noSQL:抛弃事务处理
NewSQL: SQL+事务处理+SQL
云原生数据库:弹性
blockchain:数据防篡改
AI:数据库内做数据处理
类似于用电,不关心电来源,只关心想用就用。
只写日志,不写页面。
一写多读
云原生和分布式是正交关系。
多写云原生数据库还未有实现的
分布式事务处理:2pc+paxos
2pc:两阶段提交,举例:叫两个人吃饭,两个个人都同意,才吃饭;有一个不同意,取消。
分布式查询处理:让节点之间协同优化
分布式高可用:容错,多副本
分布式时钟:全局时钟递增
网络IO比磁盘IO更快,对磁盘和网络的优化
etl:extract,transform,load
对分析而言,列存储更合理,数据的压缩
数据分析是实时的,
多副本:data fresh问题
多主机
适合更新少,分析多的
AI4DB:数据的调优,经验可以学出来。
DB4AI:扩展SQL,使用SQL使用AI。
SMP对称架构,DIE访问对应块(DRAM)很快,访问别的块就慢很多。
适合AP,并发计算,向量化执行,聚集算子。
内存数据库:充分利用内存,利用log防止数据丢失。假设数据能够全部加载到内存。(不使用2pc,使用原子锁)
减少事务的时延
分布式为啥火?
1.满足实际应用
2.机会更多