一: 数据类型的优化
更小的通常更好
简单就好
尽量避免null,而使用空字符串""
1.varchar类型根据实际内容长度保存数据
1.1:使用最小的符合需求的长度
1.2:varchar(n),n小于255,使用额外的一个字节保存保存长度,n大于255,使用额外的两个字节保存长度
1.3:varchar(10)和varchar(255)保存同样的内容"zhangsan",硬盘存储空间相同,但内存的占用空间不同,是指定的大小
1.4:varchar在mysql5.6之前变更长度,都会导致锁表
1.5:使用场景
- 1.5.1:存储长度波动较大的数据,如文章,有的很短,有的很长
- 1.5.2:字符串很少更新的场景,因为每次更新都会重算并使用额外的存储空间来存储长度
- 1.5.3:适合保存多字节字符。如:汉字,特殊字符等
2.char固定长度的字符串
2.1:最大长度255
2.2:会自动删除末尾的空格
2.3:检索效率,写效率比varchar高,以空间换时间
2.4:使用场景
- 2.4.1:存储长度波动不大的数据
- 2.4.2:存储短字符串,经常更新的字符串
3.时间类型
3.1:datetime
- 3.1.1:占用8个字节
- 3.1.2:与时区无关,数据库底层时区配置,对datetime无效
- 3.1.3:可保存到毫秒,可保存时间范围大
- 3.1.4:不要使用字符串存储日期类型,占用空间大,损失日期类型函数的便捷性
3.2:timestamp
- 3.2.1:占用4个字节
- 3.2.2:依赖数据库配置设置的时区
- 3.2.3:精确到秒,时间范围是1970-01-01到2038-01-19
- 3.2.4:采用整形存储
- 3.2.5:自动跟新timestamp列的值
3.3:date
- 3.3.1:占用3个字节
- 3.3.2:用于保存1000-01-01到9999-12-31之间的日期
- 3.3.3:使用date类型,还可以进行利用日期时间函数进行日期之间的计算
二:合理使用范式和反范式
范式
优点
- 范式化的更新通常比反范式的要快
- 当数据较好的范式化后,通常没有或者很少有重复的数据
- 范式化的数据比较小,可以放在内存中,操作比较快
缺点
- 通常需要进行关联
反范式
优点
- 所有的数据都在同一张表中,可以避免关联
- 可以设计有效的索引
缺点
- 表内的冗余数据较多,删除某些数据后可能造成数据关联的丢失
三: 主键的选择
1.代理主键
与业务无关的,无意义的数字序列
2.自然主键
事务属性中的自然唯一标识
3.推荐使用代理主键
不与业务耦合,容易维护
四: 字符集的选择
纯拉丁文能表示的内容,通常不会选择出Latinl之外的字符编码
如果包含中文,特殊字符等,为了通用性,选择utf8mb4,而不是utf8,因为utf8只能存储两个字节的中文,像汉字"中"需要占用三个字节
mysql数据库的数据类型可以精确到每个字段,所以根据存储数据的特点,每个表每个字段都可以选择不同的数据类型,进而降低IO次数,提高缓存命中率
五: 存储引擎的选择
比较类目 | MyISAM | InnoDB |
---|---|---|
索引类型 | 非聚簇索引 | 聚簇索引 |
支持事务 | 否 | 是 |
支持表锁 | 是 | 是 |
支持行锁 | 否 | 是 |
支持外键 | 否 | 是 |
支持全文检索 | 是 | 是(5.6后支持) |
适合操作类型 | 大量seect | 大量insert,update,delete |