MySQL作为一款开源数据库,在互联网公司的使用率可以说是非常之高,因为它开源,性能强劲,使用友好,但不管是多么好的东西,如果使用不当,那效果肯定是会打折扣的,笔者经验不多,但也试试分享我对 mysql 使用的一些看法。
表结构设计:所有表必须拥有自增主键,推荐使用长整型(BIGINT),避免使用复合主键。最小列原则,比如类型字段一般 TINYINT 就可以满足; 存储 hash 字段一般 CHAR(32) 就可以满足。一般的整型存储,最好加上 UNSIGNED, 毕竟我们目前使用 有符号 的还是比较少的。每个列后面必须加上 comment 解释其意义,如果特别长,可以放在 README.md。提供表示创建时间和更新时间的 created_at updated_at 字段,建议使用 TIMESTAMP 类型,并使用 mysql 内建的 CURRENT_TIMESTAMP 作为默认值。对于内容类字段优先考虑使用 utf8mb4 编码以支持 emoji 表情文字,如果预期数据量较大,尽量将内容较长且不用于查询的 BLOB、TEXT 列单独建表。不推荐使用 NULL,优先使用有业务意义的默认值替代 NULL (比如用户的简介,可以通过 DEFAULT '' 来代替 NULL)。
索引设计:如果线上存在复合条件查询,务必通过复合索引,覆盖到查询中的所有条件字段 。务必将 ORDER BY 中的列覆盖在索引中,不然很容易出现对性能影响严重的 file sort。不推荐建立过多的索引,禁止冗余的索引、不使用的索引需要及时删除。推荐扩展现有索引,而不是建立新的索引。过多的索引容易影响优化器决策而形成严重性能问题。
查询设计:避免在查询中使用 OR,会难于利用索引。线上禁止使用 JOIN 操作。避免在线上使用 GROUP BY 查询。做范围查询时,务必使用 LIMIT 参数限制查询范围。不推荐使用 DELETE,对于内容类数据优先考虑软删除。必要时拆分复杂查询为 根据查询条件检索 id 列表 + 根据 id 列表检索实体内容 两条 SQL。
表结构命名规范:命名应使用富有意义的英文词汇,多个单词组成的,中间以下划线分割。命名全部采用小写,并且名称前后不能加引号。同一个模块的表尽可能使用相同的前缀,表名尽可能表达含义,例如:member_group 和 member_notice 。字段命名应尽可能使用表达实际含义的英文单词或缩写,如,公司 ID,不要使用 corporation_id, 而用 corp_id 即可。布尔值类型的字段命名为 is+ 描述。如 member 表上表示是否为 enabled 的会员的字段命名为 is_enabled。出现引用其他表数据情况的时候,外键处 的名称要使用 column_name_id, 比如引用 member,则该列名称为 member_id。如果各业务线有自己的命名标准,务必业务线内保持统一。
SQL 语句规范:关键字均使用大写,比如 SELECT FROM WHERE LIMIT UPDATE ORDER BY DESC字段名称以及查询条件使用小写,比如 user.id查询值如果是字符串则使用 '' 单引号扩起来查询值如果是数值则禁止使用 '' 单引号
当然,我这里只是一些简单的规范,关于 MySQL 的性能优化其实是很复杂的一门学问,我还得好好钻研钻研。