关系型数据库和非关系型数据库
关系型数据库 (SQL)
MySql、Oracle、Sql Sever....
通过表与表之间的行和列储存数据
非系型数据库 (NoSQL)
Redis、MogDB
对象存储,通过对象属性来决定
INNODB与MYISAM的区别
可在创建表后加入 EMGING=INNODB 来选择INNODB引擎
MYISAM INNODB
事务支持 不支持 支持
数据行锁定 不支持 支持
外键约束 不支持 支持
全文索引 支持 不支持
表空间大小 较小 较大,约为两倍
常用操作:
MYISAM:节约空间,运行速度较快。
INNODB:安全性高,事务处理,支持多表多用户操作。
在物理内存上:
MySql表数组都存储在data文件夹内
INNODB:在数据库表中只有一个 *.frm 文件,以及 ibdata1 文件夹
MYISAM:对应文件
*.frm 表结构定义文件
*.MYD 数据文件
*.MYI 索引文件
设置数据库的表的字符集
不设置的话默认字符集为Latin1,不支持中文。可以在创建表语句后加 charset=utf8
也可以修改 my.ini 文件 character-set-server=utf8 但不建议 因为如果更换环境容易发生乱码的问题。
delete和TAUNCATE的区别
相同:都可以删除数据,不会影响表结构
不同:
1.TAUNCATE 重新设置自增列 计数器会归零
2.TAUNCATE 不会影响事务
3.delete删除如果引擎是 INNODB 重启数据库后自增列会从1开始(存在内存中)
4.delete删除如果引擎是 MYISAM 重启数据库后继续从上一个子增量开始(存在文件中)
建表规约#
强制部分#
【强制】 表达是与否概念的字段,必须使用 is_xxx 的方式命名,数据类型是 unsigned tinyint (1 表示是,0 表示否)。
说明:任何字段如果为非负数,必须是 unsigned。
正例:表达逻辑的字段名 is_deleted,1 表示删除,0 表示未删除。
【强制】 表名、字段名必须使用小写字母或数字,禁止出现数字开头,禁止两个下划线中间只出现数字。数据库字段名的修改代价很大,因为无法进行预发布,所以字段名称需要慎重考虑。
说明:MySQL 在 Windows 下不区分大小写,但在 Linux 下默认是区分大小写。因此,数据库名、表名、字段名,都不允许出现任何大写字母,避免节外生枝。
正例:aliyun_admin,rdc_config,level3_name
反例:AliyunAdmin,rdcConfig,level_3_name
【强制】 禁用保留字,如 desc、range、match、delayed 等,请参考 MySQL 官方保留字。
【强制】 主键索引名为 pk_ 字段名;唯一索引名为 uk_ 字段名;普通索引名则为 idx_ 字段名。
说明:pk_ 即 primary key;uk_ 即 unique key;idx_ 即 index 的简称。
【强制】 小数类型为decimal,禁止使用 float 和 double。
说明:在存储的时候,float 和 double 都存在精度损失的问题,很可能在比较值的时候,得到不正确的结果。如果存储的数据范围超过 decimal 的范围,建议将数据拆成整数和小数并分开存储。
【强制】 如果存储的字符串长度几乎相等,使用 char 定长字符串类型。
【强制】 varchar 是可变长字符串,不预先分配存储空间,长度不要超过 5000,如果存储长度大于此值,定义字段类型为 text,独立出来一张表,用主键来对应,避免影响其它字段索引效率。
【强制】 表必备三字段:id, create_time, update_time。
说明:其中 id 必为主键,类型为 bigint unsigned、单表时自增、步长为 1。create_time, update_time
的类型均为 datetime 类型。
推荐部分#
【推荐】 表的命名最好是遵循“业务名称_表的作用”。
正例:alipay_task / force_project / trade_config。
【推荐】 库名与应用名称尽量一致。
【推荐】 如果修改字段含义或对字段表示的状态追加时,需要及时更新字段注释。
【推荐】 字段允许适当冗余,以提高查询性能,但必须考虑数据一致。
冗余字段应遵循:
不是频繁修改的字段。
不是 varchar 超长字段,更不能是 text 字段。
不是唯一索引的字段。
正例:商品类目名称使用频率高,字段长度短,名称基本一不变,可在相关联的表中冗余存储类目名称,避免关联查询。
【推荐】 单表行数超过 500 万行或者单表容量超过 2GB,才推荐进行分库分表。
说明:如果预计三年后的数据量根本达不到这个级别,请不要在创建表时就分库分表。
参考部分#
【参考】 合适的字符存储长度,不但节约数据库表空间、节约索引存储,更重要的是提升检索速度。
事务
什么是事务
同时成功或者同时失败
事务原则:ACID原则 原子性,一致性,隔离性,持久性 (脏读,幻读......)
原子性(Atomicity):要么都成功,要么都失败
一致性(Consistency):事务前后的数据完整性要保持一致
隔离性(Isolation):多个用户并发访问数据库时,数据库为每个用户开启的事务,不能被其他的操作数据所干扰
持久性(Durability):事务一旦提交则不可逆,被持久化到数据库中
隔离所导致的一些问题
脏读:一个事务读取了另一个没有提交的数据
不可重复读:在一个事务内读取表中某一行数据。多次读取结果不同
虚读(幻读):在一个事务内读取到了别的事务插入的数据,导致前后读取不一致
索引
主键索引(PRIMARY KEY):唯一的标识 非空且唯一
唯一索引(UNIQUE KEY):避免重复的列出现
常规索引(KEY/INDEX):默认的 index、key 关键字来设置
全文索引(FULLTEXT):在特定引擎下有,MyISAM 快速定位数据
基础语法:
MySql创建函数方法:
创建函数之前必须要写:DELIMITER$$
Creat一个索引:
索引在数据量小的时候用处不大 但在数据量大的时候区别十分明显
索引原则
索引不是越多越好
经常变动的字段不要加索引 会发生索引重构影响性能
数据量小的表不需要加索引
索引一般加在经常用来查询的字段上
索引的数据结构:
Hash :类型的索引
Btree: InnoDB 默认的数据结构
权限管理及备份
MySQL备份
为什么要备份:
保证重要数据不丢失
数据转移
MySQL数据库备份方式
直接拷贝物理文件
在可视话工具中手动到处
使用命令到处 mysqldump 命令行导出
规范数据库设计
糟糕的数据库:
数据冗余 浪费空间
数据插入删除都会麻烦 异常【屏蔽使用物理外键】
程序的性能差
较好的数据库:
节省空间
保证数据库完整性
方便开发
软件开发中关于数据库的设计
收集信息,分析需求
标记实体,落实字段
标记实体之间的关系
三大范式
为什么需要数据规范化?
信息重复
更新异常
插入异常
无法正常显示信息
删除异常
丢失有效的信息
第一范式
原子性:保证每一列不可再分
第二范式
前提:满足第一范式
每张表只描述一件事情
第三范式
前提:满足第一范式和第二范式
保证数据表中的每一列都和主键直接相关 不能间接相关
规范和性能的问题
关联查询的表不得超过三张
考虑商业化的需求和目标,数据库的性能更加重要
故意给某些表增加一些冗余的字段(从多表查询变为单表)
数据库连接池
由于连接释放十分浪费资源
池化技术:准备一些预先的资源,调用时可以直接连接
最大连接数:业务最高承受上限
最小连接数:程序常用的链接数
等待超时
编写连接池 实现接口 DataSource
DBCP
C3P0
Druid:阿里巴巴
使用了这些数据库连接池后,我们在项目开发中就不需要编写数据库代码了
DBCP:
导入jar包:commons-pool commons-dbcp
C3P0:
c3o0-0.9.5.5 mchange-commons-java-0.2.19
结论
无论使用什么数据源,本质都是一样的,DataSource 接口不会变,方法就不会变
SHOW PROFILE
1.开启 show profile功能 默认记录15条sql
set profiling = no
2.通过Show profiles查看语句运行时间
3.诊断具体sql语句 show profile cup,block io for query 加Query_ID
4.严重排查参数