内容为日常学习笔记
转载请注明:陈熹 chenx6542@foxmail.com (简书号:半为花间酒)
若公众号内转载请联系公众号:早起Python
理论知识
存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持InnoDB、MyISAM、Memory 等多个存储引擎。现在最常用的存储引擎是 InnoDB
,它从 MySQL 5.5.5 版本开始成为了默认存储引擎
InnoDB支持事务
和原子性操作
连接MySQL
mysql -h$ip -P$port -u$user -p
net start mysql # 或 mysql.server start
mysql -u root -p
mysql -u user -p db_name # 直接进入指定数据库
导入导出
导出现有数据库数据:
mysqldump -u用户名 -p密码 数据库名称 >导出文件路径 # 结构+数据
mysqldump -u用户名 -p密码 -d 数据库名称 >导出文件路径 # 结构
导入现有数据库数据:
mysqldump -uroot -p密码 数据库名称 <导入文件路径
数据库操作
SELECT version(), current_date, now(); # 查看mysql版本号和日期、时间
SELECT version(); select now(); select current_date; # 分开写则表格分开
SOURCE c://test.sql # 用txt文件保存命令该后缀名 可直接执行文件内的命令
\c # 撤销先前输入
\G # 按行输出
SHOW DATABASES; # 查看所有数据库
SELECT DATABASE(); # 进入数据库后查看当前数据库
# 数据库名称组成除了三大项还可以含$,但不能是纯数字
CREATE DATABASE db_name; # 创建spiders数据库
CREATE DATABASE db_name DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# 安装utf8规则排序
# utf8mb4支持墨迹表情
USE db_name; # 进入数据库
ALTER DATABASE db_name DEFAULT CHARSET SET utf8; # 修改数据库
DROP DATABASE db_name; # 删除数据库
DROP VARIABLES LIKE 'datadir'; # 查看数据库所在位置
SHOW TABLES; # 查看所有表
DESCRIBE db_name; # 查看表的描述,也可以用 DESC table;
SELECT * FROM db_name; # 查看表中所有数据
SELECT host,user FROM db_name; # 大小写不敏感
INSERT INTO person(name,birth) VALUES('A',1994-01-01); # VALUE也可
表操作
- 创建表
CREATE TABLE students(
nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY, # 自增列必须是索引,最好是主键
name VARCHAR(20),
num INT NOT NULL DEFAULT 2)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
- 主键
一张表只能有一个主键,值是唯一的(或多列组合是唯一的),不能重复不能为空,一般情况下自增列设置为主键。
常用 nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY
一张表可以多个唯一列
CREATE TABLE tb1(
nid INT NOT NULL,
num INT NOT NULL,
PRIMARY KEY(nid,num) # 两列组成一个主键
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
主键的作用:
- 约束
- 索引,加速查找
- 外键
# 创建表时创建
CREATE TABLE color(
INT NOT NULL PRIMARY KEY,
name CHAR(16) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;;
CREATE TABLE fruit(
INT NOT NULL PRIMARY KEY,
smt CHAR(32) NOT NULL ,
color_id INT NOT NULL,
CONSTRAINT fk_fruit_color FOREIGN KEY (color_id) REFERENCES color(nid)
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;;
# 表外创建
ALTER TABLE students ADD CONSTRAINT fk_tb2_tb1 FOREIGN KEY tb2(info) REFERENCES tb1(nid);
- 修改表属性
# 添加列:
ALTER TABLE 表名 ADD 列名 类型
# 删除列:
ALTER TABLE 表名 DROP COLUMN 列名
# 修改列:
ALTER TABLE 表名 MODIFY COLUMN 列名 类型; 一般只改类型
ALTER TABLE 表名 CHANGE 原列名 新列名 类型; 可改列名+类型
# 添加主键:
ALTER TABLE 表名 ADD PRIMARY KEY(列名);
# 删除主键:
ALTER TABLE 表名 DROP PRIMARY KEY;
ALTER TABLE 表名 MODIFY 列名 INT, DROP PRIMARY KEY;
# 添加外键:
ALTER TABLE 从表 ADD CONSTRAINT 外键名称(形如:FK_从表_主表)FOREIGN KEY 从表(外键字段) REFERENCES 主表(主键字段);
# 删除外键:
ALTER TABLE 表名 DROP FOREIGN KEY 外键名称;
# 修改默认值:
ALTER TABLE tbl ALTER列名 SET DEFAULT 1000;
# 删除默认值:
ALTER TABLE tbl ALTER列名 DROP DEFAULT;
数据类型
bit(M): 二进制位,M为1~64,默认M=1
-
int:
nid int unsigned 最大4GB (2**32 − 1)
整数类型中的m仅用于显示,对存储范围无限制
tinyint: 有符号-128127,无符号0255,默认是signed
MySQL中无布尔值,使用tinyint(1)构造
bigint
smallint
-
decimal: 精确的小数,能够存储精确值的原因在于其内部按照字符串存储
num decimal(6,2) 6个有效数字(总长度),2位小数,最大是65和30
float,double: 不精确
-
char: 唯一定长,其他都是变长,数据不到该长度其他空间会闲置,查找速度快,浪费空间
varchar: 变长,相对于char效率低。查找下一列时不确定跳多少存储空间
字符最大是255
text:字符最大是65535 2**16-1
mediumtext:2**24-1
longtext:2**32-1
-
二进制数据:
TinyBlob、Blob、MediumBlob、LongBlob
上传文件,blob强制二进制方式。现在多用varchar保存路径,上传文件保存在硬盘
-
时间
DATE YYYY-MM-DD(1000-01-01/9999-12-31) TIME HH:MM:SS('-838:59:59'/'838:59:59') YEAR YYYY(1901/2155) DATETIME YYYY-MM-DD HH:MM:SS(1000-01-01 00:00:00/9999-12-31 23:59:59 Y) TIMESTAMP YYYYMMDD HHMMSS(1970-01-01 00:00:00/2037 年某时)
-
枚举 enum
支持65535个元素枚举
CREATE TABLE shirts ( name VARCHAR(40), size ENUM('x-small', 'small', 'medium', 'large', 'x-large')); INSERT INTO shirts (name, size) VALUES ('dress shirt','large'), ('t-shirt','medium'),('polo shirt','small');
单选
-
集合 set
CREATE TABLE myset (col SET('a', 'b', 'c', 'd')); INSERT INTO myset (col) VALUES ('a,d'), ('d,a'), ('a,d,a'), ('a,d,d'), ('d,a,d');
可以多选
表内容操作
# 写的顺序
SELECT... FROM...
WHERE...
GROUP BY... HAVING...
ORDER BY...
LIMIT...
# 执行顺序
FROM...
WHERE...
GROUP BY...
SELECT...
HAVING...
ORDER BY...
LIMIT...
- 增
INSERT INTO 表 (列名,列名...) VALUES(值,值,值...);
INSERT INTO 表 (列名,列名...) VALUES(值,值,值...),(值,值,值...); # 增加多条数据
INSERT INTO 表 (列名,列名...) SELECT 列名,列名 FROM 表; # 后面选择列不需要空格
# 如果数据可以转则允许互转
insert into students(name,age) SELECT caption,nid FROM tb2 WHERE nid>2;
- 删
DELETE FROM 表;
DELETE FROM 表 WHERE id=1 AND name='alex';
DELETE FROM 表 WHERE id > 1 OR name='alex';
# 删除和清空
DROP TABLE student; # 删除表
DELETE FROM student; # 清空表,有自增列则清空后自增记忆存在
TRUNCATE (TABLE) student;# 快速清空表,有自增列则清空后自增从1重新开始
- 改
UPDATE students SET name = 'alex' WHERE id>1;
UPDATE salary SET sex = IF(sex = 'm', 'f', 'm') # 条件判断更改
UPDATE salary SET sex = char(ascii('m') + ascii('f') - ascii(sex));
UPDATE salary
SET
sex = CASE sex
WHEN "m" THEN "f"
ELSE "m" END;
# UPDATE和JOIN
UPDATE A JOIN B ON A.URL = B.URL
SET member_id = '00012138'
WHERE LOGIN_time BETWEEN '2019' AND '2020'
AND B.class_id = 'TNT'; # BETWEEN 后可以再跟AND
- 查
SELECT * FROM 表;
# 要全部列可以把列名写一遍,效率比*高
SELECT * FROM 表 WHERE id <> 1; # 即!=
SELECT * FROM 表 WHERE id BETWEEN 3 AND 5; # 即 id>=3 AND id<=5
SELECT nid,name,gender FROM 表 WHERE id%2 = 1;
SELECT DISTINCE name FROM score WHERE num < 60;
# distinct 去重只保留各组一项 也可以使用group by
WHERE (class, name) NOT IN (SELECT class, name FROM B) # 多个字段限制
- 条件选择
SELECT * FROM 表 WHERE id BETWEEN 5 AND 16; # 也支持多个并列
SELECT * FROM 表 WHERE id IN(11,22,33)
SELECT * FROM 表 WHERE id NOT IN(11,22,33)
SELECT * FROM 表 WHERE id IN(select nid from 表)
- 通配符模糊匹配
SELECT * FROM 表 WHERE name LIKE 'ale%' # - ale开头的所有(多个字符串) where ... like ''
SELECT * FROM 表 WHERE name LIKE 'ale_' # - ale开头的所有(1个字符)
SELECT * FROM 表 WHERE name LIKE '_le%'
- 限制/分页
SELECT * FROM 表 LIMIT 5; # 前5行
SELECT * FROM 表 LIMIT 4,5; # 从第4行下一行开始的5行
SELECT * FROM 表 LIMIT 5 OFFSET 4 # 从第4行开始的5行,与上一条功能一样
- 排序
SELECT * FROM 表 ORDER BY 列 ASC # 根据 “列” 从小到大排列
SELECT * FROM 表 ORDER BY 列 DESC # 根据 “列” 从大到小排列
SELECT * FROM 表 ORDER BY 列1 DESC,列2 ASC # 根据 “列1” 从大到小排列,如果相同则按列2从小到大排序,否则一列相同时其他列默认升序排序
- 分组+聚合
# group by获取各组第一行作为标识,其余行丢弃
SELECT num FROM 表 GROUP BY num
# 分组的原理默认是升序排序,也可以降序
SELECT num FROM 表 GROUP BY num DESC
SELECT count(1) FROM 表 GROUP BY num # 也可使用
SELECT count(name) FROM students GROUP BY classid
# count(1) 和 count(name)区别
# 如果name中有null则count(name)不记录,其余时候二者完全一样
SELECT count(distinct name) FROM students GROUP BY classid # 去重
# sum只能对int类型计算 否则是0
# 多列分组 多个均相同的分到一组
SELECT num,nid FROM 表 GROUP BY num,nid
SELECT num,nid FROM 表 WHERE nid > 10 GROUP BY num,nid ORDER BY nid DESC
SELECT num,nid,count(*) AS count,sum(score) AS sum,avg(score),max(score),min(score) FROM 表 GROUP BY num,nid # as 是自定义命名
# 如果要对聚合函数进行筛选需引入having 顺序在group by后
SELECT num FROM 表 GROUP BY num HAVING max(id) > 10
# 聚集函数
count sum max min avg group_concat(字符串拼接) # 都会去除null
# sum(1) 等于 count(1) 只能针对int类型
# group_concat
SELECT id,GROUP_CONCAT(name) FROM aa GROUP BY id;
SELECT id,GROUP_CONCAT(name SEPARETOR ';') FROM aa GROUP BY id;
SELECT id,GROUP_CONCAT(DISTINCT name) FROM aa GROUP BY id;
SELECT id,GROUP_CONCAT(name ORDER BY name DESC) FROM aa GROUP BY id;
# 语法如下
DISTINCT name ORDER BY id DESC SEPARETOR '-'
group by 必须在where之后,order by之前
- 组合
# 纵向组合,并以第一个表字段为准
# 组合,自动处理重合
SELECT nickname FROM A UNION SELECT name FROM B;
# 组合,不处理重合
SELECT nickname FROM A UNION ALL SELECT name FROM B;
- 连表
# 需要多行之间满足一个需求就需要join
# 笛卡尔积
SELECT * FROM students,disc_info;
# 根据对应关系连表,实际等同于inner join
SELECT * FROM students,disc_info WHERE students.discipline = disc_info.nid;
SELECT students.name,disc_info.discipline FROM students,disc_info WHERE students.discipline = disc_info.nid;
# join 左右连接如果无对应关系显示NULL,join效率高
# 取交集,inner join,也可以理解成过滤掉含NULL数据行的左右连接
SELECT A.num, A.name, B.name FROM
A INNER JOIN B
ON A.nid = B.nid;
# 右连接,right join
SELECT A.num, A.name, B.name FROM
A RIGHT JOIN B
ON A.nid = B.nid
# 左连接,right join
SELECT A.num, A.name, B.name FROM
A LEFT JOIN B
ON A.nid = B.nid
获得的结果是个表,可以作为子查询的临时表
- CASE WHEN 判断
CASE WHEN 表达式
THEN 输出
WHEN 表达式 # 多少个WHEN都可以
THEN 输出
ELSE
输出
END
SELECT id,name,
(
CASE WHEN classid = 1 THEN 2
WHEN classid =2 THEN 1
ELSE classid END
) AS clid
FROM stu;
# 把tidydata转为正常数据
SELECT name,
MAX(CASE WHEN project = '基础' THEN score ELSE NULL END) as '基础',
MAX(CASE WHEN project = '爬虫' THEN score ELSE NULL END) as '爬虫',
MAX(CASE WHEN project = 'SQL' THEN score ELSE NULL END) as 'SQL'
FROM score;
# 查询两门及以上不及格同学信息
SELECT st.Name, AVG(score) as Score_n
FROM SC JOIN student st ON SC.SId = st.SId
GROUP BY SId
HAVING COUNT(CASE WHEN Score < 80 THEN 1 ELSE NULL END) >=2;
- 半连接
SELECT
id,NAME,classid
FROM
student tf
WHERE
id = (
SELECT
max(id)
FROM
student ts
WHERE
ts.classid = tf.classid
);
# 也可以用常规方法
SELECT
id,NAME,classid
FROM
(
SELECT
max(id)
FROM
student
GROUP BY
classid
);
- 索引
# 基于B+树
# 数据分的越开的列则建索引效果越好
# OR情况不能用索引
# 如果是联合索引 前部过滤条件可以做为索引
# 在SQL语句前加EXPLAIN就可以明确是否走索引
# 创建索引
CREATE INDEX name_index ON student(name);
# 聚簇索引叶子节点跟着数据,非聚簇索引叶子节点跟着主键(聚簇索引)
# 非聚簇走完多数会再走聚簇,除非SELECT内容均被包含于索引(全覆盖索引)
# MySQL中主键是聚簇索引,其他均为非聚簇索引
# 如果没有主键,内部会虚拟一个AUTO_INCREMENT的主键
- 视图
CREATE VIEW V1 AS # 反复利用某个临时表则可以创建视图
SELECT * FROM stu WHERE id > 10;
# 视图是一个动态表,会从物理表动态读出来。但无法直接对虚拟表即视图修改
# 修改视图
ALTER VIEW V1 AS SELECT * FROM stu WHERE id > 20;
# 删除视图
DROP VIEW V1;
- 触发器
DELIMITER // # 修改终止符
CREATE TRIGGER tri_before_insert_tb1 BEFORE INSERT INTO tb1 FOR EACH ROW
BEGIN
INSERT INTO tb2(name) VALUES('chenx');
INSERT INTO tb2(name) VALUES(NEW.sname); # 指代新插入的一行,OLD可以用在DELETE和UPDATE
END //
DELIMITER ; # 修改回原终止符
# BEFORE可以换成AFTER,INSERT可以换成DELETE或者UPDATE
# 删除触发器
DROP TRIGGER tri_before_insert_tb1;
- 函数
# 内置函数
SELECT CURDATE(); # 执行函数的用法
SELECT DATE_FORMAT(ctime, "%Y-%m") FROM stu GROUP BY DATE_FORMAT(ctime, "%Y-%m") # 时间格式化
# 自定义函数
DELIMITER \\
CREATE FUNCTION f1(
i1 INT,
i2 INT)
RETURNS INT# 强类型语言
BEGIN
DECLARE num INT DEFAULT 0; # 声明变量
SET num = i1 + i2;
RETURN(num);
END \\
DELIMITER ;
- 事务、存储过程、循环等见
https://www.cnblogs.com/wupeiqi/articles/5713323.html
pymysql
import pymysql
# 连接配置信息
config = {
'host':'localhost',
'port':3306,
'user':'root',
'password':'xxxx',
'charset':'utf8'}
db = pymysql.connect(**config)
cursor = db.cursor() # 获得MySQL的操作游标,利用游标来执行SQL语句,后续可以用execute()方法
cursor.execute('''执行SQL语句''') # 该语句的返回值是受影响的函数
cursor.commit() # 确认执行语句,如果是查询则不需要commit()
cursor.close() # 关闭游标
db.close() # 关闭数据库
# 如果是动态参数必须用传递参数而不能用字符串拼接
imp = 'A'
SQL = 'INSERT INTO student(name) VALUES(%s)'
cursor.execute(SQL,imp)
# 如果一条记录需要传递tuple
cursor.execute('INSERT INTO student(name,age) VALUES(%s,%d)',('A',25))
# 故单条单个记录也可以写成
cursor.execute('INSERT INTO student(name) VALUES(%s)',('A',))
# 如果多条记录需要用executemany()
lst = [('A',25),('B',25)]
cursor.executemany('INSERT INTO student(name,age) VALUES(%s,%d)',lst)
# 如果要返回查询的结果
print(cursor.fetchall()) # 以元祖内嵌元祖返回
print(cursor.fetchmany(10))
print(cursor.fetchone()) # 取一次后指针下移,下次执行fetchone()返回下一个记录;以元祖返回
results = cursor.scroll(0, mode='absolute') # 绝对指针,回到总记录第0位置
results = cursor.scroll(-1, mode='relative') # 相对指针,回到当前记录上1位置
# 设置游标参数,将返回值从tuple改为dictionary
cursor = db.cursor(cursor = pymysql.cursors.DictCursor)
# 操作完成后返回最后一个自增id
nid = cursor.lastrowid