背景
最近开发了一个分享言论的小程序后端, 开发过程中遇到了微信用户的昵称是😎(emoji)的, 结果发现数据库储存的是乱码显示了一大堆??号
这让我很是头疼, 到网上找到了一个外国同行写的blog,算是解决了mysql储存emoji表情的问题
首先这个问题是由于编码位数不同引起的, 在mysql中默认的utf8是3位的, emoji表情是四位, 所以用三位空间储存四位的储存空间肯定出问题,
所示emoji储存需要占位更高的utf8mb4进行储存
在默认使用utf8编码创建的数据库,我们修改时需要按照有大到小的顺序依次修改, 也就是说:
数据库 -> 表 - > 字段
数据库修改
ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
表修改
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
字段修改
ALTER TABLE table_name CHANGE column_name column_name VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 注意这里的database_name,table_name,column_name,191都是根据自身情况进行修改的
这个时候我们就已经修改完了想要储存emoji表情的字段
可是在实际的操作下, 我发现储存的emoji表情仍然为问号,经过反复的对比发现数据库的修改已经完成了。
于是想到了是不是django这边的出了问题,后来查到了需要在django settings 中数据库database中加入一个指定字符编码的项,
DATABASES = {
'default': {
'ENGINE':'django.db.backends.mysql',
'HOST':'127.0.0.1',
'USER':'root',
'PASSWORD':'123456',
'NAME':'dacoff',
'OPTIONS': {'charset':'utf8mb4'},
}
}
这样就可以在mysql中保存emoji表情了
查考文章:https://mathiasbynens.be/notes/mysql-utf8mb4#column-index-length