1.数据命名规范
所有数据库对象名称必须使用小写字母并用下划线分割(mysql对大小写敏感)
数据库对象名称禁止使用mysql关键字
数据库对象命名要能做到见名识义,最好不要超过32个字符
临时库和表必须以tmp为前缀,并以日期为后缀
备份库和表必须以bak为前缀并以日期为后缀
所有储存相同数据的列名和列类型必须一致
2.数据库基本设计规范
所有表必须使用Innodb存储引擎
数据库和表的字符集统一使用utf8,避免由于字符集转换成的乱码
所有的表和字段都要添加注释
尽量控制单表数据量的大小,建议控制在500w以下(历史数据归档,分库分表)
谨慎使用mysql分区表(分区表在物理上表现为多个文件,在逻辑上表现为一个表)
尽量做到减少冷热数据分离,减小表的宽度(减少磁盘IO,保证热数据的内存缓存命中率)
禁止在表中建立预留字段
禁止在数据库中存储图片,文件等二进制数据
禁止在线上做数据库压力测试
禁止从开发环境,测试环境直连生产环境数据库
3.数据库索引设计规范
限制每张表上的索引数量,建议单张表索引不超过5个
每个Innodb表必须有一个主键
不能使用更新频繁的列为主键,不适用多列主键
不要使用UUID,MD5,HASH,字符串作为主键
主键建议使用自增加ID
尽量避免使用外键,数据完整性使用业务逻辑实现
4.数据库字段设计规范
优先选择符合存储需要的最小的数据类型
尽量将字符串转化为数字类型存储
INET_ATON INET_OA
对于非负整型采用无符号整形进行存储
一个由UTF8字符集存储的汉字占3个字节
varchar(num)
避免使用text,blob数据类型
避免使用ENUM数据类型(修改ENUM值需要使用alter语句,orderby 效率低)
尽可能把所有列定义为NOT NULL(NULL 需要额外空间来保存,占用更多空间)
禁止使用字符串来保存时间
使用TIMESTAMP或DATETIME类型存储时间
对于财务相关的金额类数据,必须使用decimal类型
5.数据库SQL开发规范
建议使用预编译语句进行数据库操作(一次解析,多次使用)
避免数据类型的隐式转换(会导致索引失效)
避免使用双%号的查询条件。如 alile '%123%'
充分利用表上已经存在的索引
一个sql只能利用到复合索引中的一列进行范围查询,意思把用到范围搜索的列放到联合索引的最右侧
程序连接不同的数据库使用不同的账号,禁止跨库查询
禁止使用select * 进行查询
禁止使用不含有字段列表的insert语句
避免使用子查询,把子查询优化为join操作(子查询的结果集无法使用索引,会产生大量的临时表)
避免使用join关联太多的表,建议不超过5个
避免同数据库的交互次数(数据库更适合处理批量操作)
使用in代替or,范围不要超过500。in相比or能更好的利用索引
禁止使用order by rand()进行随机排序
where从句中禁止对列进行函数转换和计算(会导致无法使用索引)
在明显不会有重复值时,使用UNION ALL而不是使用UNION(UNIION会把娑有数据放到临时表中,再进行去重操作 UNION ALL不会执行去重)
拆分复杂的大SQL为多个小SQL( 一个SQL会占用一个线程,拆分之后可以实现并行)
6.数据库操作行为规范
超100万行的批量写操作,要分批多次进行操作(写操作)。
对于大表使用pt-online-schema-change修改表结构
禁止为程序使用的账号赋予super权限
对于程序连接数据库账号,遵循权限最小原则
程序使用数据库账号只能在一个DB下使用
程序使用数据库账号不能有drop权限