12/19/2016 11:16:38 AM
了解Sql
-
什么是数据库?
- 数据库与数据结构有异曲同工之妙,都包含两个层面的意思:数据+组织方式。数据库是一个保存有组织的数据的容器(通常是一个文件或一组文件),数据结构是以某种组织的方式存储的数据集合(存储于内存中)。
- 数据库可以比拟为一个文件柜,其是一个存储数据的物理位置
-
表
- 存储某种特定类型的结构化文件
- 名字唯一
- 定义数据在表中如何存储(数据类型、字段命名,数据如何分解等)
- 模式:关于数据库和表的布局及特性的信息
-
列和数据类型
- 列是表中一个字段
- 数据类型是所允许的一类数据的类型
- 数据类型可以限制列中的数据种类
- 帮助正确的排序数据
- 优化磁盘使用
-
行
- 表中的一个记录
-
主键
- 唯一标识表中每行数据的某列(或某组列)
- 任意两行不能有相同的主键值
- 主键值不允许为NULL值
- 最佳实践
- 不更新主键列中的值
- 不重用主键列中的值
- 不在主键列中使用可能会更改的值
- 唯一标识表中每行数据的某列(或某组列)
12/19/2016 11:18:15 AM
MySql 简介
- 什么是MySql?
- 一种DBMS(数据库管理系统),即Mysql是一种数据库软件
- 成本--开源
- 性能--很快
- 可信赖
- 简单
- DBMS
- 基于共享软件系统的DBMS
- Microsoft Access和FileMaker
- 基于客户端-服务器的DBMS
- MySql、Oracle、Microsoft SQL Server
- 基于共享软件系统的DBMS
检索数据
- 检索单个列
- select column_name from tbl_name;
- select * from tbl_name;
- select distinct column_name from tbl_name;
- select column_name from tbl_name limit num;
- select column_name from tbl_name limit start_index, num;//第一行为0
- select column_name from tbl_name limit num offset index;
- select tbl_name.column_name from db_name.tbl_name;//全限定名查询
排序检索数据
- 排序数据
- select * from tbl_name order by column_name;
- select * from tbl_name order by column_name1, column_name2;
- select * from tbl_name order by column_name asc/desc;
- select * from tbl_name order by column_name asc/desc limit num;
过滤数据
- 使用where子句
- select * from tbl_name where column_name = value order by column_name desc;
- =
- <>
- !=
- <
- <=
- 大于等于 >=
- BETWEEN ... AND ...
- NULL
数据过滤
- 组合where子句
- select * from tbl_name where colunm_name >= value and column_name <= value2;
- or
- in
- select * from tbl_name where column_name in(value, value2...) order by column_name;
- not in
使用通配符进行过滤
- like操作符
- select * from tbl_name where column_name like '%xxx%'
- select * from tbl_name where column_name like '_xxx'; _只匹配单个字符
用正则表达式进行搜索
- 正则表达式是用来匹配文本的特殊的串(字符集合)
- select * from tbl_name where column_name REGXP 'xxx' order by column_name; - select * from tbl_name where column_name REGXP '.xxx' order by column_name; - select * from tbl_name where column_name REGXP '.xxx | .yyy' order by column_name; - select * from tbl_name where column_name REGXP '[123]xxx' order by column_name; - select * from tbl_name where column_name REGXP '[^123]xxx' order by column_name; - select * from tbl_name where column_name REGXP '[a-z]xxx' order by column_name; - select * from tbl_name where column_name REGXP ' \\.' order by column_name; - ^ 文本的开始 - $ 文本的结尾 - [[:<:]] 词的开始 - [[:>:]] 词的结尾
5/5/2017 9:07:17 AM
管理事务处理
- 事务处理
- 事务处理是一种机制,用来管理必须成批执行的操作(这里特指MySQL操作),以保证(数据库)不包含不完整的操作结果。
- 采用事务处理机制,可以保证一组操作或者作为整体完全执行,或者完全不执行。
- 具体来说,如果没有错误发生,整组语句提交给数据库引擎,由其将操作结果写到数据库表中,若发生错误则进行回滚(完全撤销该组所有操作),恢复数据到某个已知且安全状态(操作执行前的状态)。
5/11/2017 9:01:27 AM
12 汇总数据
-
聚集函数
- mysql封装好的对表中数据进行统计的一组函数
- 运行在行祖上,计算和返回单个值(针对某列计算)的函数
-
常用聚集函数介绍
- AVG() 返回某列的平均值
- 忽略值为NULL的行
- COUNT() 返回某列的行数
- COUNT(*) 统计的列中可能包括空值,但是有某列不为空
- COUNT(column) 则不统计NULL列
- MAX() 返回某列的最大值
- 忽略列值为NULL的行
- MIN() 返回某列的最小值
- 忽略列值为NULL的行
- SUM() 返回某列值之和
- AVG() 返回某列的平均值
示例
select
count(*) as num_items,
min(prod_price) as price_min,
max(prod_price) as price_max,
avg(prod_price) as price_avg
from
products
where
prod_price >= 10;
13 分组数据
写在前面的话
我们可以使用聚集函数实现汇总数据的功能,此种汇总是针对一个类别的数据,换句话说就是汇总的分类只有一个。那么问题来了,如果想要对一个数据集进行多个类别的统计又该怎么办呢?举个例子,现在有一个班30个人,分成5组,每组6人,分别计算6组的平均成绩。如果只是使用单纯的AVG函数无法实现分组统计的功能,此时数据库中的分组语句group by登场了。
本质上,分组语句是将分组统计的逻辑放在了数据库层面实现,及针对某列进行数据汇总统计。
常用语
-
创建分组
- 分组语句通常与聚集函数联合使用,实现分组汇总数据的功能
- group by语句必须在where语句之后,order by语句之前
- group by必须包含select查询的from后表的所有字段,可不包括left/right join字段
-- 分组统计各组同学成绩 select group_id, avg(score) as score from student group by group_id;
-
过滤分组
- 对分组进行过滤,where是分组钱过滤数据,having是分组后过滤数据
-- 分组统计各组同学成绩且只统计出平均分大于等于80的 select group_id, avg(score) as score from student group by group_id having avg(score) >= 80