12/19/2016 11:16:38 AM

了解Sql

什么是数据库？
- 数据库与数据结构有异曲同工之妙，都包含两个层面的意思：数据+组织方式。数据库是一个保存有组织的数据的容器（通常是一个文件或一组文件），数据结构是以某种组织的方式存储的数据集合（存储于内存中）。
- 数据库可以比拟为一个文件柜，其是一个存储数据的物理位置
表
- 存储某种特定类型的结构化文件
- 名字唯一
- 定义数据在表中如何存储（数据类型、字段命名，数据如何分解等）
- 模式：关于数据库和表的布局及特性的信息
列和数据类型
- 列是表中一个字段
- 数据类型是所允许的一类数据的类型
  - 数据类型可以限制列中的数据种类
  - 帮助正确的排序数据
  - 优化磁盘使用
行
- 表中的一个记录
主键
- 唯一标识表中每行数据的某列（或某组列）
  - 任意两行不能有相同的主键值
  - 主键值不允许为NULL值
- 最佳实践
  - 不更新主键列中的值
  - 不重用主键列中的值
  - 不在主键列中使用可能会更改的值

12/19/2016 11:18:15 AM

MySql 简介

什么是MySql？
- 一种DBMS（数据库管理系统），即Mysql是一种数据库软件
- 成本--开源
- 性能--很快
- 可信赖
- 简单
DBMS
- 基于共享软件系统的DBMS
  - Microsoft Access和FileMaker
- 基于客户端-服务器的DBMS
  - MySql、Oracle、Microsoft SQL Server

检索数据

检索单个列
- select column_name from tbl_name;
- select * from tbl_name;
- select distinct column_name from tbl_name;
- select column_name from tbl_name limit num;
- select column_name from tbl_name limit start_index, num;//第一行为0
- select column_name from tbl_name limit num offset index;
- select tbl_name.column_name from db_name.tbl_name;//全限定名查询

排序检索数据

排序数据
- select * from tbl_name order by column_name;
- select * from tbl_name order by column_name1, column_name2;
- select * from tbl_name order by column_name asc/desc;
- select * from tbl_name order by column_name asc/desc limit num;

过滤数据

使用where子句
- select * from tbl_name where column_name = value order by column_name desc;
- =
- <>
- !=
- <
- <=
- 大于等于 >=
- BETWEEN ... AND ...
- NULL

数据过滤

组合where子句
- select * from tbl_name where colunm_name >= value and column_name <= value2;
- or
- in
  - select * from tbl_name where column_name in(value, value2...) order by column_name;
- not in

使用通配符进行过滤

like操作符
- select * from tbl_name where column_name like '%xxx%'
- select * from tbl_name where column_name like '_xxx'; _只匹配单个字符

用正则表达式进行搜索

正则表达式是用来匹配文本的特殊的串（字符集合）

- select * from tbl_name where column_name REGXP 'xxx' order by column_name;
- select * from tbl_name where column_name REGXP '.xxx' order by column_name;
- select * from tbl_name where column_name REGXP '.xxx | .yyy' order by column_name;
- select * from tbl_name where column_name REGXP '[123]xxx' order by column_name;
- select * from tbl_name where column_name REGXP '[^123]xxx' order by column_name;
- select * from tbl_name where column_name REGXP '[a-z]xxx' order by column_name;
- select * from tbl_name where column_name REGXP ' \\.' order by column_name;
- ^ 文本的开始
- $ 文本的结尾
- [[:<:]] 词的开始
- [[:>:]] 词的结尾

5/5/2017 9:07:17 AM

管理事务处理

事务处理
- 事务处理是一种机制，用来管理必须成批执行的操作（这里特指MySQL操作），以保证（数据库）不包含不完整的操作结果。
- 采用事务处理机制，可以保证一组操作或者作为整体完全执行，或者完全不执行。
- 具体来说，如果没有错误发生，整组语句提交给数据库引擎，由其将操作结果写到数据库表中，若发生错误则进行回滚（完全撤销该组所有操作），恢复数据到某个已知且安全状态（操作执行前的状态）。

5/11/2017 9:01:27 AM

12 汇总数据

聚集函数
- mysql封装好的对表中数据进行统计的一组函数
- 运行在行祖上，计算和返回单个值（针对某列计算）的函数
常用聚集函数介绍
- AVG() 返回某列的平均值
  - 忽略值为NULL的行
- COUNT() 返回某列的行数
  - COUNT(*) 统计的列中可能包括空值，但是有某列不为空
  - COUNT(column) 则不统计NULL列
- MAX() 返回某列的最大值
  - 忽略列值为NULL的行
- MIN() 返回某列的最小值
  - 忽略列值为NULL的行
- SUM() 返回某列值之和
示例

select
    count(*) as num_items,
    min(prod_price) as price_min,
    max(prod_price) as price_max,
    avg(prod_price) as price_avg
from
    products
where
    prod_price >= 10;

13 分组数据

写在前面的话

我们可以使用聚集函数实现汇总数据的功能，此种汇总是针对一个类别的数据，换句话说就是汇总的分类只有一个。那么问题来了，如果想要对一个数据集进行多个类别的统计又该怎么办呢？举个例子，现在有一个班30个人，分成5组，每组6人，分别计算6组的平均成绩。如果只是使用单纯的AVG函数无法实现分组统计的功能，此时数据库中的分组语句group by登场了。

本质上，分组语句是将分组统计的逻辑放在了数据库层面实现，及针对某列进行数据汇总统计。

常用语

创建分组
- 分组语句通常与聚集函数联合使用，实现分组汇总数据的功能
- group by语句必须在where语句之后，order by语句之前
- group by必须包含select查询的from后表的所有字段，可不包括left/right join字段
```
-- 分组统计各组同学成绩
select 

    group_id, avg(score) as score

from
     student

group by group_id；
```

过滤分组

对分组进行过滤，where是分组钱过滤数据，having是分组后过滤数据

-- 分组统计各组同学成绩且只统计出平均分大于等于80的
select 

    group_id, avg(score) as score

from
     student

group by group_id

having avg(score) >= 80

MySql基础篇