Sharding-JDBC认为对于分片策略存有两种维度:
数据源分片策略(DatabaseShardingStrategy):数据被分配的目标数据源
表分片策略(TableShardingStrategy):数据被分配的目标表
两种分片策略API完全相同,但是表分片策略是依赖于数据源分片策略的(即:先分库然后才有分表)
分片算法
通过分片算法将数据分片,支持通过=、>=、<=、>、<、BETWEEN和IN分片。分片算法需要应用方开发者自行实现,可实现的灵活度非常高。
目前提供4种分片算法。由于分片算法和业务实现紧密相关,因此并未提供内置分片算法,而是通过分片策略将各种场景提炼出来,提供更高层级的抽象,并提供接口让应用开发者自行实现分片算法。
精确分片算法
对应PreciseShardingAlgorithm,用于处理使用单一键作为分片键的=与IN进行分片的场景。需要配合StandardShardingStrategy使用。范围分片算法
对应RangeShardingAlgorithm,用于处理使用单一键作为分片键的BETWEEN AND、>、<、>=、<=进行分片的场景。需要配合StandardShardingStrategy使用。复合分片算法
对应ComplexKeysShardingAlgorithm,用于处理使用多键作为分片键进行分片的场景,包含多个分片键的逻辑较复杂,需要应用开发者自行处理其中的复杂度。需要配合ComplexShardingStrategy使用。Hint分片算法
对应HintShardingAlgorithm,用于处理使用Hint行分片的场景。需要配合HintShardingStrategy使用。
分片策略
包含分片键和分片算法,由于分片算法的独立性,将其独立抽离。真正可用于分片操作的是分片键 + 分片算法,也就是分片策略。目前提供5种分片策略。
标准分片策略
对应StandardShardingStrategy。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。StandardShardingStrategy只支持单分片键,提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法。PreciseShardingAlgorithm是必选的,用于处理=和IN的分片。RangeShardingAlgorithm是可选的,用于处理BETWEEN AND, >, <, >=, <=分片,如果不配置RangeShardingAlgorithm,SQL中的BETWEEN AND将按照全库路由处理。复合分片策略
对应ComplexShardingStrategy。复合分片策略。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。ComplexShardingStrategy支持多分片键,由于多分片键之间的关系复杂,因此并未进行过多的封装,而是直接将分片键值组合以及分片操作符透传至分片算法,完全由应用开发者实现,提供最大的灵活度。行表达式分片策略
对应InlineShardingStrategy。使用Groovy的表达式,提供对SQL语句中的=和IN的分片操作支持,只支持单分片键。对于简单的分片算法,可以通过简单的配置使用,从而避免繁琐的Java代码开发,如: t_user_$->{u_id % 8} 表示t_user表根据u_id模8,而分成8张表,表名称为t_user_0到t_user_7。Hint分片策略
对应HintShardingStrategy。通过Hint指定分片值而非从SQL中提取分片值的方式进行分片的策略。不分片策略
对应NoneShardingStrategy。不分片的策略。
建表语句
CREATE TABLE `t_order_0` (
`order_id` bigint DEFAULT NULL COMMENT '订单号',
`cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
`order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
CREATE TABLE `t_order_1` (
`order_id` bigint DEFAULT NULL COMMENT '订单号',
`cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
`order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
CREATE TABLE `sku_1` (
`sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
`sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
`order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
CREATE TABLE `sku_0` (
`sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
`sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
`order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
1: 重点
order_id 是bigint 类型的 我采用了行表达式分片策略,直接配置的,由于找不到怎么配置varchar 所以我才不得不开始学习怎么重写实现方法。
代码1 使用标准分片:
@Slf4j
public class MyPreciseShardingAlgorithm implements PreciseShardingAlgorithm<String> {
/**
* Sharding.
* 实现标准分片策略,通过计算分到不同的表来实现分表策略。
* @param collection available data sources or tables's names
* @param preciseShardingValue sharding value
* @return sharding result for data source or table's name
*/
@Override
public String doSharding(Collection<String> collection, PreciseShardingValue<String> preciseShardingValue) {
Comparable value = preciseShardingValue.getValue();
String columnName = preciseShardingValue.getColumnName();
String logicTableName = preciseShardingValue.getLogicTableName();
log.info("collection:" + JSON.toJSONString(collection) + ",preciseShardingValue:" + JSON.toJSONString(preciseShardingValue));
String data = value.toString();
int size = collection.size();
for(String tableName: collection){
int index = Math.abs(data.hashCode() % size);
if(tableName.endsWith(index+"")){
return tableName;
}
}
return null;
}
}
配置:
spring:
main:
allow-bean-definition-overriding: true
# 相关的配置
shardingsphere:
props:
sql:
show: true
datasource:
names: ds1
ds1:
type: com.zaxxer.hikari.HikariDataSource
driver-class-name: com.mysql.cj.jdbc.Driver
jdbcUrl: jdbc:mysql://localhost:3306/springcloud?serverTimezone=CTT&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&useSSL=false
username: root
password: root
sharding:
tables:
# 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
t_order:
# 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
# 这个配置是告诉sharding有多少个表
actual-data-nodes: ds1.t_order_$->{0..1}
# 配置其分片策略和分片算法
table-strategy:
# 行表达式
inline:
# 配置sharding的计算列
sharding-column: order_id
# 配置sharding的表达式,对应的n_id必须和sharding-column的值对应,否则报错
algorithm-expression: t_order_$->{order_id % 2}
# 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
sku:
# 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
# 这个配置是告诉sharding有多少个表
actual-data-nodes: ds1.sku_$->{0..1}
# 配置其分片策略和分片算法
table-strategy:
standard:
sharding-column: sku_id
precise-algorithm-class-name: com.xulei.spring.shardConfig.MyPreciseShardingAlgorithm
具体配置在starter下面的json文件。
实际案例:
select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
from t_order,sku
where t_order.order_id=sku.order_id
and t_order.order_id =3
因为t_order表里面是采用了order_id 进行分片,所以具体执行sql 只查询了1个库 t_order_1。
sql 修改:
select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
from t_order,sku
where t_order.order_id=sku.order_id
and sku.order_id =3
结果就是全表扫描了。因为sku 表是根据sku_id 来进行分表的