mysql的分区之key,hash分区

MySQl的分区与分表

1 分区的认识

1) 情景假设

假如有1000万条数据,放到一个表中会出现查询速度很慢的情况.但是如果我们将数据分散保存到10个表中,每一个表中100万数据,这是速度就会得到很大的提升!但是让我们手动分表,就会造成很大的麻烦.所以我们直接使用mysql的分区技术.

2) 分区的示意图

图片.png

1 虽然内部分成了四个区,但是对外提供服务的依旧是一张表.
2 存到哪里以及从哪里取,这个时候就要使用mysql内部的分区算法.

3) 四种分区

具体为:

key hash ---->[求余方式]
range list ---->[范围方式]
其中 key和hash 与 业务联系不紧密,就是删除一个分区数据不会丢失.
range 和 list 与 业务联系紧密 ,删除分区之后,相应分区数据就会丢失.
注意:分表字段必须是主键 或 主键的一部分(复合主键索引的第二个字段)

2 key分区----取余

  create table tableName (
      字段.......   
   )engine=表引擎 partition by key (id) partitions num;
注意:这里的分区不区别表的引擎是innodb和myisam.

a 新建一个sql表实现分区,分区字段一定是主键


图片.png

b 查看分区的文件


图片.png

以key算法分区 ,参数是id,分10个区(也就意味着有是个文件)
Partition by 分区算法 (参数) 分区选项。

c 随机插入数据进行测试


图片.png

执行刷新一次,才能重新将数据写入到data中
flush tables;

d插入数据之后,查看保存数据的文件


图片.png

注意:这里数据插入之后自动分成两个文件.

算法key是内部指定的,到底什么数据,放在哪一个分区中我们没有办法操作,肯能导致数据分配的不均匀.

3 hash分区

HASH分区主要用来确保数据在预先确定数目的分区中平均分布,要做的只是基于将要被哈希的列值指定一个列值或表达式,以 及指定被分区的表将要被分割成的分区数量。hash分区所使用的字段一定要是主键!!

hash语法:

create table 表名(
 .........
)engine=MyISAM partition by hash(算法函数)) partitions 分区的数量;

a 新建一个学生表,让学生信息,根据月份进行存储

create table hash_1(
  id mediumint unsigned auto_increment not null,
  birthday date,
  primary key (id,birthday) 
)engine=MyISAM partition by hash(month(birthday)) partitions 12;
解释:
month()提取日期中的月份
hash(month(birthday))   按照日期中的月份进行分区

b 查看分区之后的数据文件


图片.png

c 插入几条数据进行测试:

insert into hash_1 values(null,'1992-05-20');
insert into hash_1 values(null,'1993-06-20');
insert into hash_1 values(null,'1993-07-20');
insert into hash_1 values(null,'1993-10-20');
#注意这里的月份,不同的月份会放到不同数据文件

d 插入数据之后,查看文件的变化


图片.png

注意:分区字段一定是主键

图片.png

1 这里的month()函数是返回日期中的月份值
2 注意这里的hash()设置的值, 可以是相关的函数也可以是一个字段,不过一定要是一个整数.

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容