分库分表理论概述

1.什么是分库分表

一个库一个表 拆分为 N个库N个表
分为垂直拆分,水平拆分

2.为什么要分库分表

随着业务发展,表的数量,以及单表数据量越来越大,而由于无法分布式部署(部分数据库支持),单台服务器资源(cpu 内存,IO)的限制,导致数据操作开销大,查询慢,因此需要进行分库分表,提高数据查询速度。
常见优化策略:
更换数据库(缓存)
SQL 索引 字段 优化
分区
读写分离
分库分表

3.读写分离

master-slave模式,mastr负责更新操作,slave负责查询操作。

4.分库分表常见方式

垂直拆分:

根据字段拆分

垂直分库:

按照业务划分,将不同业务数据单独拆分成一个库。“微服务治理”做法类似,每个微服务单独使用一个库。


垂直分库
垂直分表

如果单表字段过多,可以通过"大表拆小表"方式将不常用或者字段长度较大的表
拆分到扩展表中,mysql是按照数据页进行存储的,如果单行数据过大,会导致数据跨页,造成额外的性能开销。


垂直分表
垂直拆分优点:
  • 业务系统解耦。
  • 与微服务治理类似,便于集中管理,监控,扩展
  • 高并发情况下提升IO,数据库连接数,单机硬件资源瓶颈
垂直拆分缺点:
  • 多表join只能通过应用程序解决,加大开发复杂度
  • 分布式事务处理复杂
  • 单表数据总量无法解决(水平切分处理)
水平拆分

将一个表中的数据以某一个字段(取模),拆分到多个表中(根据内容拆分

水平拆分

水平拆分的优点:
  • 使单表的数量保持在一定数量,提高查询性能
  • 切分后表结构相同,程序改动小
水平拆分的缺点:
  • 数据扩容
  • 分片规则难以抽象(不同的库,难以固定某个字段拆分,比如商品可以商品IDhash到某个库中,订单表需要根据用户IDhash到某个库中)
  • 分布式事务,部分业务无法关联join

5.分库分表带来的问题

  • 分布式事务
  • 表join
    -分布式全局唯一Id(twitter开源的 snowFlake)

6.分库分表算法

取模

通过 某一个字段进行hash userId%3 =1 则分配到1库。可以使数据均匀分布,避免数据热点问题。数据扩容是明显的缺点,可以采用 一致性hash 算法

范围

比如按月 按省分配

预定义

1亿数据 每个库存100万数据,可以预先创建10个库。

7.常用的中间件

分为两种类型:
Proxy代理:
mycat(重)、mysql-proxy atlas、sharding-proxy(sharding-sphere )

Proxy代理

jdbc直连:
TDDL(淘宝 半开源) 、sharding-jdbc(sharding-sphere )

jdbc直连

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 2018.5.17周四雨转晴三年级十二班李淑颖麻麻 今天也没什么特别记录的,白天一天也不见孩子们,今晚上姐姐倒是挺...
    lsy颖阅读 214评论 0 0
  • 清晨心情很低落觉得天都是灰暗的最近为了搬家很是心烦心里有点失落觉得每三年就要搬一次这次说好了不搬了把所有的烦心事咽...
    哈哈同学阅读 188评论 0 0
  • 1、列表页特点: 同类内容—列表页所有信息都是平级的; 规则排序—找寻页面按某一顺序排列; 包含全部—包含某类信息...
    keke_f5a2阅读 686评论 0 1

友情链接更多精彩内容