MySQL版本:8.0版本
CHAR
和VARCHAR
类型相似,但在存储、检索方式、最大长度和是否保留末尾空格四个方面存在差异。
长度:
-
CHAR(0-255)
类型为CHAR的列的长度是固定的,可以在创建表时指定该长度。比如列的定义为CHAR(30),则该列最多可以存储30个字符。
-
VARCHAR(0-65535)
类型为VARCHAR的列的长度是可变的,在创建表时指定的长度为最大长度,最大长度的值受行最大长度的限制和使用的编码字符。比如列的类型为VARCHAR(512),则该列最多可以存储512个字符。
存储:
-
CHAR
由于CHAR类型的列的长度是固定的,如果插入的值的长度小于定义的长度,则会在插入值的末尾添加空格以确保值的长度恰好等于定义的长度。如果没有开启严格SQL模式,如果插入值的长度超过列允许的最大长度,值将会被截断以确保满足长度要求并产生一个告警。通过开启严格的SQL模式,对非空字符的截断将产生一个错误而不是告警并抑制值的插入。
-
VARCHAR
VARCHAR是变长字符串;VARCHAR存储时不会使用空格填充;VARCHAR存储包括两部分:1或2字节的前缀(表示数据的长度)和数据。如果存储的数据的字节数不超过255则使用1个字节的前缀;如果存储的长度超过255字节则使用2字节长度的前缀。无论使用哪种SQL模式,截断超过VARCHAR类型的空格都将产生一个告警。
检索方式:
-
CHAR
当检索CHAR列的值时,如果没有开启
PAD_CHAR_TO_FULL_LENGTH SQL
模式,则会移除尾部的空格。 -
VARCHAR
根据标准SQL,在存储和检索值时保留尾部空格。
样例:
下面的表格通过存储不同的字符串到CHAR(4)和VARCHAR(4)类型的列中展示了CHAR和VARCHAR之间的不同。
Value | CHAR(4) |
Storage Required | VARCHAR(4) |
Storage Required |
---|---|---|---|---|
'' |
' ' |
4 bytes | '' |
1 byte |
'ab' |
'ab ' |
4 bytes | 'ab' |
3 bytes |
'abcd' |
'abcd' |
4 bytes | 'abcd' |
5 bytes |
'abcdefgh' |
'abcd' |
4 bytes | 'abcd' |
5 bytes |
表格最终一行是实际存储占用的空间(未开启严格SQL模式),如果启用严格SQL模式,超过列长度的值将不会被存储并产生一个错误。
InnoDB
将长度大于或等于768字节的固定长度字段编码为可变长度字段,这样可以使用off-page存储。例如如果字符占用超过3个字节,那么一个类型为CHAR(255)的列的长度可能超过768字节。
将同一个给定值存储在CHAR(4)和VARCHAR(4)列中,则从这些列检索的值并不总是相同的,因为检索时会从CHAR列中删末尾空格。以下示例说明了这种差异:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.01 sec)
mysql> INSERT INTO vc VALUES ('ab ', 'ab ');
Query OK, 1 row affected (0.00 sec)
mysql> SELECT CONCAT('(', v, ')'), CONCAT('(', c, ')') FROM vc;
+---------------------+---------------------+
| CONCAT('(', v, ')') | CONCAT('(', c, ')') |
+---------------------+---------------------+
| (ab ) | (ab) |
+---------------------+---------------------+
1 row in set (0.06 sec)
CHAR,VARCHAR和TEXT列中的值根据分配给该列的字符集排序规则进行排序和比较。
字符串比较规则
MySQL排序规则有一个名为 PAD SPACE的属性,但基于UCA 9.0.0及更高版本的Unicode排序规则除外(属性的值为NO PAD)。
可以从INFORMATION_SCHEMA.COLLATIONS
表中获取每种排序规则的pad属性:
SELECT * FROM COLLATIONS
对于非二进制字符串(CHAR,VARCHAR,TEXT),字符串排序规则中的pad属性决定字符串末尾的空格在字符串比较中的处理方式。拥有NO PAD
值的字符串排序规则将尾部的空格视作其他字符,参与到字符串的比较中。拥有PAD SPACE
值的字符串排序规则将忽略字符串尾部的空格,这些空格不参与字符的比较。服务器SQL模式对尾随空格的比较行为没有影响。
对于字符串尾部空格被截断而且不参与字符串比较的情况,如果一个字段上拥有唯一索引,如果插入该类的值仅存在尾部的空格数不同的差异,这将产生一个重复key的错误。