SQL 必知必会
在mac终端操作sqlite:
- cd 数据库所在的目录
- sqlite3 数据库文件名 //带后缀)(此时已经打开数据库)
- .tables //显示数据库中所有已经创建的表
- .schema //显示所有表的模式
- .headers on //显示字段名(查询时才会显示)
- .mode column/list/line
- 执行sql语句必须在末尾加分号
distinct
SELECT DISTINCT name FROM TB_BOOK_TAG;
关键字distinct
,用于去除name列中所有行中重复元素。
limit
SELECT name FROM TB_BOOK_TAG LIMIT 5;
关键字limit
,返回name列指定行数。
SELECT name FROM TB_BOOK_TAG LIMIT 5 OFFSET 0;
等同于下面写法(shortcut)
SELECT name FROM TB_BOOK_TAG LIMIT 0,5;
limit ... offset ...
关键字LIMIT ... OFFSET ...
,limit
后跟的数字指定显示多少行,offset
后跟的数字表示从什么位置开始。(0是第一行)
注释
--this is a comment
关键--加注释
,单行注释。
/* comments */
关键/**/
,多行注释。
order by
SELECT * FROM TB_BOOK_TAG ORDER BY name;
关键字:order by
+ 字段名,按该字段所属列的首字母进行排序。要确保该子句是select
语句中最后一条子句,否则会出现错误。
SELECT publisher,pubdate FROM TB_BOOK_ENTITY ORDER BY publisher,pubdate;
关键字:order by
+ 字段名 + 字段名,首先按publisher进行排序,然后按照pubdate进行排序。对于第二个字段的排序,当且仅当具有多个相同的publisher时才会对其按照pubdate进行排序,如果publisher列中所有值都是唯一的,则不会按pubdate进行排序。
desc
SELECT publisher,pubdate FROM TB_BOOK_ENTITY ORDER BY pubdate DESC;
关键字:desc
,order by 默认是按升序进行排序,当在字段名后加desc
后,将对该字段进行降序排列。
SELECT pubdate,price FROM TB_BOOK_ENTITY ORDER BY pubdate DESC,price;
pubdate
按降序排列,price
,仍然按照升序排列(在pubdate相同的行)。所以,如果想在多个列上进行降序,必须对每一列都指定desc
关键字。
where
SELECT * FROM TB_BOOK_TAG WHERE count = 1;
关键字:where
,指定搜索条件进行过滤。where子句在表名(from子句)之后给出。在同时使用where
和order by
时,应该让order by
位于where
之后。
操作符 | 说明 |
---|---|
= | 等于 |
<> | 不等于 |
!= | 不等于 |
< | 小于 |
<= | 小于等于 |
!< | 不小于 |
> | 大于 |
>= | 大于等于 |
!> | 不大于 |
BETWEEN | 在指定的两个值之间 |
IS NULL | 为NULL值 |
注意:NULL和非匹配
通过过滤选择不包含(如<>)指定值的所有行时,你可能希望返回含NULL值的行,但是这做不到,因为NULL有特殊的含义,数据库不知道它们是否匹配,所以在进行匹配过滤或非匹配过滤时,不会返回这些结果。
where...and...
select * from contacts where name = "fff" and mobile = "d";
关键字:and
,组合where子句。
where...or...
select * from contacts where name = "fff" or mobile = "d";
关键字:or
,组合where子句。
注意:在同时使用and和or时要注意求值顺序,and优先级大于or。因此在任何时候使用具有and和or操作符的where子句时,都应该使用圆括号明确地分组操作符
where...in...
select * from contacts where mobile in ('12', '444') order by mobile;
关键字:in
,用来指定条件范围,范围中的每个条件都可以进行匹配。in
操作符一般比一组or
操作符执行的更快。in
最大的优点是可以包含其他select语句,能够更动态的建立where子句。
not
select * from contacts where not mobile = '12';
关键字:not
,where子句中用来否定其后条件的关键字。上面的例子也可以用<>
。在简单语句中,not
没有什么优势,但是,在更复杂的子句中,not
非常有用。例如,在与in
操作符联合使用时,not
可以非常简单的找出与条件列表不匹配的行。如下例子:
SELECT * FROM CONTACTS WHERE NOT mobile IN ('111111', '3333');
like
通配符(wildcard)用来匹配值的一部分的特殊字符。
搜索模式(search pattern)由字面值,通配符或两者组合构成的搜索条件。
通配符搜索只能用于文本字段(字符串),非文本数据类型字段不能使用通配符搜索
%通配符
在搜索字符串中,%表示任何字符出现任意次数
select * from tb_book_tag where name like '计算机%';
注意字符串后面所跟的空格:
许多DBMS会用空格来填补字段内容。例如,如果某列有50个字符,而存储文本为Fish bean bag toy(17个字符),则为填满该列会在文本末尾追加33个空格。如果此时用‘F%y’来检索,便检索不到上述字符串。简单解决办法是‘F%y%’。更好的解决办法是用函数去掉空格。
'%' 不会匹配为NULL的行
下划线_通配符
用途和%一样,但它只匹配单个字符,而不是多个。
select * from tb_book_tag where name like '计算机__';
使用通配符的技巧
SQL通配符搜索比其他搜索更耗时。
1. 不要过度使用通配符,如果其他操作能达到目的,使用其他操作。
2. 在确实需要使用的时候,也尽量不要把它用在搜索模式的开始处。把通配符置于开始处,搜索起来是最慢的。
3. 特别要注意通配符的位置不要放错。
创建计算字段
计算字段并不实际存在于数据库表中,计算字段是运行时在SELECT语句内创建的。
select rtrim('~ ') || name from tb_book_tag;
关键字:||
和rtrim()
。 ||
拼接操作符。rtrim()
去除文本右边的空格。trim()
去除两边的空格。
as
select name || 'is foolish' as title from contacts;
关键字:as
,全称alias。它指示SQL创建一个包含指定计算结果的名为title的计算字段,任何客户端应用可以按名称引用这个列,就像一个实际表列一样。
执行算术计算
+ - * /
select mobile, (mobile + 1)*2 as count_mobile from contacts;
关键字:+
或-
或*
或/
;
函数
一下所用到的是适用于sqlite的函数,不一定适用于其他DBMS。
upper()
select name ,upper(name) as name_upper from contacts;
关键字:upper()
转大写
sqlite中常用于文本处理函数:
函数 | 说明 |
---|---|
length() | 返回字符串的长度 |
lower() | 将字符串转小写 |
ltrim() | 去掉字符串左边的空格 |
rtrim() | 去掉字符串右边的空格 |
upper() | 将字符串转大写 |
avg()
select avg(mobile) as avg_id from contacts;
关键字:avg()
,对表中某列所有行或特定行中的数据求平均值。该函数会忽略值为NULL的行。
count()
select count(*) as num_cust from contacts;
select count(name) as num_name from contacts;
关键字:count()
,使用count(*)
,对表中行的数目进行计数,不管表列中是否包含NULL值。使用count(column_name)
,对特定列中具有值的行进行计数,忽略NULL值。
sum()
select sum(mobile) as sum_mobile from contacts;
关键字:sum()
, 忽略NULL值
聚集不同值
count(distinct name)
select count(distinct name) from tb_book_tag;
组合聚集函数
select count(*) as num_items, min(count) as count_min, max(count) as count_max, avg(count) as count_avg from tb_book_tag;
分组数据
group by
select name, count(*) as num_names from tb_book_tag group by name order by name;
关键字:group by
,group by子句必须出现在where子句之后,order by子句之前。
group by...having...
select name , count(*) as amounts from tb_book_tag group by name having amounts >= 10;
关键字:having
。对分组进行过滤。而where对分组不起作用,它是针对表中每一行来过滤。
使用子查询
select cust_id
from orders
where order_num in (select order_num
from orderitems
where prod_id = 'RGAN01');
注意:
作为子查询的select语句只能查询单个列。企图检索多个列将返回错误。
同时要注意性能问题。
使用子查询作为计算字段
select cust_name,
cust_state,
(select count(*)
from orders
where orders.cust_id = customers.cust_id) as orders from customers
order by cust_name;
联结表
关系表
为理解关系表,来看一个例子:
有一个包含产品目录的数据库表,其中每类物品占一行,对于每种物品,要存储的信息包括产品描述,价格以及生产该产品的供应商。
现有同一供应商生产的多种物品,那么在何处存储供应商名联系方法等信息?将这些数据与产品信息分开存储的理由是:
- 同一供应商的每个产品,其供应商的信息是相同的,对每个产品重复此信息既浪费时间又浪费空间;
- 如果供应商信息发生变化,只需修改一次即可;
- 如果有重复数九,则很难保证每次输入该数据的方式都相同,
相同的数据出现多次决不是一件好事,这是关系数据库设计的基础。关系表的设计就是要把信息分解成多个表,一类数据一个表。各表通过某些共同的值相互关联(所以才叫关系数据库)。
如果数据存储在多个表中,怎样用一条select语句就检索出数据?
答案是使用联结,联结是一种机制,用来在一条select语句中关联表
select vend_name, prod_name, prod_price
from products, vendors
where vendors.vend_id = products.vend_id;
等同于下面的写法:
select vend_name, prod_name, prod_price
from vendors inner join products
on vendors.vend_id = products.vend_id;
在联结两个表时,实际要做的是将第一个表中的每一行与第二个表中的每一行配对。where
子句作为过滤条件,只包含那些匹配给定条件的行。没有where
子句,第一个表中的每一行将与第二个表中的每一行配对,而不管他们逻辑上是否能匹配在一起。这种联结称为等值联结(equijoin),也称为内联结(inner join)。
笛卡尔积(cartesian product):
由于没有联结条件的表关系返回的结果为笛卡尔积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。
返回笛卡尔积的联结也叫叉联结(cross join)。
SQL不限制一条select
语句可以联结的表的数目。如下:
select prod_name, vend_name, prod_price, quantity
from orderitems, products, vendors
where products.vend_id = vendors.vend_id
and orderitems.prod_id = products.prod_id
and order_num = 20007;
注意:性能考虑
DBMS在运行时关联指定的每个表,以处理联结。这种处理可能非常耗资源,因此应该注意不要联结不必要的表。
创建高级联结
使用表别名
select cust_name, cust_contact
from customers as c, orders as o, orderitems as oi
where c.cust_id = o.cust_id
and oi.order_num = o.order_num
and prod_id = 'RGAN01';
使用表别名的两个主要理由:
- 缩短SQL语句
- 允许在一条select语句中多次使用相同的表
自联结
select cust_id, cust_name, cust_contact
from customers
where cust_name = (select cust_name
from customers
where cust_contact = 'Jim Jones');
以上子查询效果等同于自联结:
select c1.cust_id, c1.cust_name, c1.cust_contact
from customers as c1, customers as c2
where c1.cust_name = c2.cust_name
and c2.cust_contact = 'Jim Jones';
通常情况下,许多DBMS处理联结远比处理子查询快得多
外联结
select customers.cust_id, orders.order_num
from customers
left outer join orders
on customers.cust_id = orders.cust_id;
检索包括没有订单顾客在内的所有顾客。
SQLite支持left outer join,但不支持right outer join.
组合查询
主要有两种情况需要使用组合查询:
- 在一个查询中从不同的表返回结构数据
- 对一个表执行多个查询,按一个查询返回数据
union
select cust_name, cust_contact, cust_email
from customers
where cust_state in ('IL', 'IN', 'MI')
union
select cust_name, cust_contact, cust_email
from customers
where cust_name = 'Fun4All';
union规则
- union必须由两条或两条以上的select语句组成,语句之间用关键字union分隔。
- union中的每个查询必须包含相同的列,表达式或聚集函数(不过,各个列不需要以相同的次序列出)。
- 列数据类型必须兼容:类型不必完全相同,但必须是DBMS可以隐含转换的类型。
union all
DBMS不取消重复行。
对组合查询结果排序
select cust_name, cust_contact, cust_email
from customers
where cust_state in ('IL', 'IN', 'MI')
union
select cust_name, cust_contact, cust_email
from customers
where cust_name = 'Fun4All'
order by cust_name, cust_contact;
在用union组合查询时,只能使用一条order by
子句,它必须位于最后一条select语句之后,DBMS用它来排序所有的select语句返回的所有结果。
插入数据
插入完整的行
insert into... values
insert into customers
values ('1000000006', 'Chenzhen', 'Hennansheng', 'henan', 'China', '476300', 'China', 'John jdge', 'chen@gaiml.com');
这种写法简单,但不安全,高度依赖表中列定义的次序,还依赖于其容易获得的次序信息。编写依赖列次序的SQL语句是很不安全的,这样做迟早会出问题。
更安全的方法:
insert into customers(cust_id,
cust_name,
cust_address,
cust_city,
cust_state,
cust_zip,
cust_country,
cust_contact,
cust_email)
values('1000000007',
'Chenzhen',
'Hennansheng',
'henan',
'shangqiu',
'476300',
'China',
'John jdge',
'chen@gaiml.com');
插入行时,DBMS将用values列表中的相应值填入列表中的对应项。其优点是,即使表的结构改变,这条insert语句仍然可以正常工作。
insert into... select...from...
insert into customers(cust_id,
cust_name,
cust_address,
cust_city,
cust_state,
cust_zip,
cust_country,
cust_contact,
cust_email)
select cust_id,
cust_name,
cust_address,
cust_city,
cust_state,
cust_zip,
cust_country,
cust_contact,
cust_email
from CustNew;
select语句从CustNew检索出要插入的值,而不是列出他们。DBMS不关心select返回的列名,它使用的是列的位置,因此select的第一列(不管列名如何)将用来填充表列中指定的第一列,如此等等。
insert select 语句可以包含where子句。
从一个表复制到另一个表
create table custcopy as select * from customers;
要想只复制部分列,可以明确给出列名。
更新和删除数据
update...set... where...
update customers
set cust_email = 'chenzhen@gmainl.com'
where cust_id = '1000000008';
更新多个列时,只需使用一条set命令:
update customers
set cust_email = 'lala@qq.com',
cust_contact = 'sam'
where cust_id = '1000000008';
没有where子句,DBMS将会更新表中所有行。
delete
delete不需要列名或通配符,因为它删除的是整行而不是删除列,要删除指定列,使用update
delete from custcopy
where cust_id = '1000000008';
如果省略where子句,它将删除表中的每个顾客。如果想从表中删除所有行,不要使用delete,可使用truncate table语句,它的速度更快,因为不记录数据的变动。
创建和操纵表
create
create table Super
(
prod_id char(10) not null,
vend_id char(10) not null,
prod_name char(254) not null,
prod_price decimal(8,2) not null, default 10.2
prod_desc varchar(1000) null
);
not null
,可以阻止插入没有值的列。默认是null
。
SQLite获得系统时间的函数date('now')
更新表
alert table
使用alert table
更改表的结构,必须给出下面的信息:
- 在
alter table
之后给出要更改的表名。 - 列出要做出哪些更改。
alter table Vendors
add vend_phone char(20);
SQLite对使用alter table执行的操作有所限制。最重要的一个限制是,它不支持使用alter table定义主键和外键。
使用alter table要极为小心,应该在进行改动钱做完整的备份(表结构和数据的备份)。数据库表的更改不能撤销,如果增加了不需要的列,也许无法删除他们。
删除表 drop table
drop table Super;
使用视图
视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。
视图(View)只不过是通过相关的名称存储在数据库中的一个 SQLite 语句。视图(View)实际上是一个以预定义的 SQLite 查询形式存在的表的组合。
SQLite仅支持只读视图,所以视图可以创建,可以读,但其内容不能更改。
删除视图 drop view
drop view customeremaillist;
创建视图create view
create view ProductCustomers as
select cust_name, cust_contact, prod_id
from Customers, Orders, OrderItems
where Customers.cust_id = Orders.cust_id
and OrderItems.order_num = Orders.order_num;
where子句与where子句
从视图检索数据时如果使用了一条where子句,则两组子句(一组子在视图中,另一组,另一组是传递给视图的)将自动组合。
视图为虚拟的表。它们包含的不是数据,而是根据需要检索数据的查询。视图提供了一种封装select语句的层次,可用来简化数据处理,重新格式化或保护基础数据。
管理事务处理
使用事务处理(transaction processing),通过确保成批的SQL操作要么完全执行,要么完全不执行,来维护数据库的完整性。
关于事务处理的一些术语:
- 事务(transaction)指一组SQL语句;
- 回退(rollback)指撤销指定SQL语句的过程;
- 提交(commit)指将未存储的SQL语句结果写入数据库表;
- 保留点(savepoint)指事务处理中设置的临时占位符,可以对它发布回退(与回退整个事务处理不同)。
可以回退哪些语句:
insert,update,delete
管理事务的关键在于将SQL语句分解为逻辑块,并明确规定数据何时应该回退,何时不应该回退。
begin;
delete from orders where order_num = 20009;
delete from orderitems where order_num = 20009;
commit;
高级SQL特性
约束,索引,触发器。
约束(constraint)
主键
create table Orders
(
order_num integer not null primary key,
cust_id char(10) not null references Customers(cust_id)
);
表中任意列只要满足以下条件,都可以用于主键。
- 任意两行主键值都不相同。
- 每行都具有一个主键值(既列中不允许NULL)。
- 包含主键的列从不修改或更新。
- 主键值不能重用。
外键
外键是表中的一列,其值必须列在另一表的主键中。
外键有助防止意外删除。
在定义外键后,DBMS不允许删除在另一个表中具有关联行的行。例如不能删除关联订单的顾客,删除改顾客的唯一方法是首先删除相关的订单。
唯一约束 unique
唯一约束用来保证一列中的数据是唯一的。与主键的区别如下:
- 表可包含多个唯一约束,但每个表只允许一个主键。
- 唯一约束列可包含NULL值。
- 唯一约束列可修改或更新。
- 唯一约束列的值可重复使用。
- 与主键不一样,唯一约束不能用来定义外键。
检查约束 check
create table OrderItems
(
...
quantity integer not null check (quantity > 0),
...
)
索引 create index
索引用来排序数据以加快搜索和排序操作的速度。想象一本书后的索引。
在开始创建索引前,应该记住以下内容:
- 索引改善检索操作的性能,但降低了数据插入,修改,和删除的性能。在执行这些操作时,DBMS必须动态的更新索引。
- 索引数据可能要占用大量的存储空间。
- 并非所有数据都适合做索引。
- 索引用于数据过滤和数据排序。
- 可以在索引中定义多个列(例如,州加上城市)。这样的索引仅在以州加城市的顺序排序时有用。如果想按城市排序,则这种索引没有用处。
CREATE INDEX index_name
ON table_name (column_name);
删除索引 drop index
DROP INDEX index_name;
触发器 Trigger
触发器是特殊的存储过程,它在特定的数据库活动发生时自动执行。
CREATE TRIGGER trigger_name [BEFORE|AFTER] event_name
ON table_name
BEGIN
-- Trigger logic goes here....
END;
示例:
CREATE TRIGGER audit_log AFTER INSERT
ON COMPANY
BEGIN
INSERT INTO AUDIT(EMP_ID, ENTRY_DATE) VALUES (new.ID, datetime('now'));
END;
列出触发器
SELECT name FROM sqlite_master
WHERE type = 'trigger';