MySql随笔 2021-04-26

关系型数据库和非关系型数据库

关系型数据库（SQL）

MySql、Oracle、Sql Sever....

通过表与表之间的行和列储存数据

非系型数据库（NoSQL）

Redis、MogDB

对象存储，通过对象属性来决定

INNODB与MYISAM的区别

可在创建表后加入 EMGING=INNODB 来选择INNODB引擎

MYISAM INNODB

事务支持不支持支持

数据行锁定不支持支持

外键约束不支持支持

全文索引支持不支持

表空间大小较小较大，约为两倍

常用操作：

MYISAM：节约空间，运行速度较快。

INNODB：安全性高，事务处理，支持多表多用户操作。

在物理内存上：

MySql表数组都存储在data文件夹内

INNODB：在数据库表中只有一个 *.frm 文件，以及 ibdata1 文件夹

MYISAM：对应文件

*.frm 表结构定义文件

*.MYD 数据文件

*.MYI 索引文件

设置数据库的表的字符集

不设置的话默认字符集为Latin1,不支持中文。可以在创建表语句后加 charset=utf8

也可以修改 my.ini 文件 character-set-server=utf8 但不建议因为如果更换环境容易发生乱码的问题。

delete和TAUNCATE的区别

相同:都可以删除数据，不会影响表结构

不同：

1.TAUNCATE 重新设置自增列计数器会归零

2.TAUNCATE 不会影响事务

3.delete删除如果引擎是 INNODB 重启数据库后自增列会从1开始（存在内存中）

4.delete删除如果引擎是 MYISAM 重启数据库后继续从上一个子增量开始（存在文件中）

建表规约#

强制部分#

【强制】 表达是与否概念的字段，必须使用 is_xxx 的方式命名，数据类型是 unsigned tinyint (1 表示是，0 表示否)。

说明：任何字段如果为非负数，必须是 unsigned。

正例：表达逻辑的字段名 is_deleted，1 表示删除，0 表示未删除。

【强制】 表名、字段名必须使用小写字母或数字，禁止出现数字开头，禁止两个下划线中间只出现数字。数据库字段名的修改代价很大，因为无法进行预发布，所以字段名称需要慎重考虑。

说明：MySQL 在 Windows 下不区分大小写，但在 Linux 下默认是区分大小写。因此，数据库名、表名、字段名，都不允许出现任何大写字母，避免节外生枝。

正例：aliyun_admin，rdc_config，level3_name

反例：AliyunAdmin，rdcConfig，level_3_name

【强制】 禁用保留字，如 desc、range、match、delayed 等，请参考 MySQL 官方保留字。

【强制】 主键索引名为 pk_ 字段名；唯一索引名为 uk_ 字段名；普通索引名则为 idx_ 字段名。

说明：pk_ 即 primary key；uk_ 即 unique key；idx_ 即 index 的简称。

【强制】 小数类型为decimal，禁止使用 float 和 double。

说明：在存储的时候，float 和 double 都存在精度损失的问题，很可能在比较值的时候，得到不正确的结果。如果存储的数据范围超过 decimal 的范围，建议将数据拆成整数和小数并分开存储。

【强制】 如果存储的字符串长度几乎相等，使用 char 定长字符串类型。

【强制】 varchar 是可变长字符串，不预先分配存储空间，长度不要超过 5000，如果存储长度大于此值，定义字段类型为 text，独立出来一张表，用主键来对应，避免影响其它字段索引效率。

【强制】 表必备三字段：id, create_time, update_time。

说明：其中 id 必为主键，类型为 bigint unsigned、单表时自增、步长为 1。create_time, update_time

的类型均为 datetime 类型。

推荐部分#

【推荐】 表的命名最好是遵循“业务名称_表的作用”。

正例：alipay_task / force_project / trade_config。

【推荐】 库名与应用名称尽量一致。

【推荐】 如果修改字段含义或对字段表示的状态追加时，需要及时更新字段注释。

【推荐】 字段允许适当冗余，以提高查询性能，但必须考虑数据一致。

冗余字段应遵循：

不是频繁修改的字段。

不是 varchar 超长字段，更不能是 text 字段。

不是唯一索引的字段。

正例：商品类目名称使用频率高，字段长度短，名称基本一不变，可在相关联的表中冗余存储类目名称，避免关联查询。

【推荐】 单表行数超过 500 万行或者单表容量超过 2GB，才推荐进行分库分表。

说明：如果预计三年后的数据量根本达不到这个级别，请不要在创建表时就分库分表。

参考部分#

【参考】 合适的字符存储长度，不但节约数据库表空间、节约索引存储，更重要的是提升检索速度。

事务

什么是事务

同时成功或者同时失败

事务原则：ACID原则原子性，一致性，隔离性，持久性（脏读，幻读......）

原子性（Atomicity）：要么都成功，要么都失败

一致性（Consistency）：事务前后的数据完整性要保持一致

隔离性（Isolation）：多个用户并发访问数据库时，数据库为每个用户开启的事务，不能被其他的操作数据所干扰

持久性（Durability）：事务一旦提交则不可逆，被持久化到数据库中

隔离所导致的一些问题

脏读：一个事务读取了另一个没有提交的数据

不可重复读：在一个事务内读取表中某一行数据。多次读取结果不同

虚读（幻读）：在一个事务内读取到了别的事务插入的数据，导致前后读取不一致

索引

主键索引（PRIMARY KEY）：唯一的标识非空且唯一

唯一索引（UNIQUE KEY）：避免重复的列出现

常规索引（KEY/INDEX）：默认的 index、key 关键字来设置

全文索引（FULLTEXT）：在特定引擎下有，MyISAM 快速定位数据

基础语法：

MySql创建函数方法：

创建函数之前必须要写：DELIMITER$$

Creat一个索引：

索引在数据量小的时候用处不大但在数据量大的时候区别十分明显

索引原则

索引不是越多越好

经常变动的字段不要加索引会发生索引重构影响性能

数据量小的表不需要加索引

索引一般加在经常用来查询的字段上

索引的数据结构：

Hash ：类型的索引

Btree： InnoDB 默认的数据结构

MySQL索引背后的数据结构及算法原理

权限管理及备份

MySQL备份

为什么要备份：

保证重要数据不丢失

数据转移

MySQL数据库备份方式

直接拷贝物理文件

在可视话工具中手动到处

使用命令到处 mysqldump 命令行导出

规范数据库设计

糟糕的数据库：

数据冗余浪费空间

数据插入删除都会麻烦异常【屏蔽使用物理外键】

程序的性能差

较好的数据库：

节省空间

保证数据库完整性

方便开发

软件开发中关于数据库的设计

收集信息，分析需求

标记实体，落实字段

标记实体之间的关系

三大范式

为什么需要数据规范化？

信息重复

更新异常

插入异常

无法正常显示信息

删除异常

丢失有效的信息

第一范式

原子性：保证每一列不可再分

第二范式

前提：满足第一范式

每张表只描述一件事情

第三范式

前提：满足第一范式和第二范式

保证数据表中的每一列都和主键直接相关不能间接相关

规范和性能的问题

关联查询的表不得超过三张

考虑商业化的需求和目标，数据库的性能更加重要

故意给某些表增加一些冗余的字段（从多表查询变为单表）

数据库连接池

由于连接释放十分浪费资源

池化技术：准备一些预先的资源，调用时可以直接连接

最大连接数：业务最高承受上限

最小连接数：程序常用的链接数

等待超时

编写连接池实现接口 DataSource

DBCP

C3P0

Druid：阿里巴巴

使用了这些数据库连接池后，我们在项目开发中就不需要编写数据库代码了

DBCP：

导入jar包：commons-pool commons-dbcp

C3P0：

c3o0-0.9.5.5 mchange-commons-java-0.2.19

结论

无论使用什么数据源，本质都是一样的，DataSource 接口不会变，方法就不会变

SHOW PROFILE

1.开启 show profile功能默认记录15条sql

set profiling = no

2.通过Show profiles查看语句运行时间

3.诊断具体sql语句 show profile cup,block io for query 加Query_ID

其它参数

4.严重排查参数

MySql随笔 2021-04-26