数据中有emoji,导致插入不了数据库

前言

前两天负责的系统,因为需要获取用户的昵称并进行入库,但是有个别用户的昵称中存在emoji表情,导致入库时报错。

报错内容:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94‘ for column

问题原因

Q:为什么我们设置表的的字符类型为utf8却不能存放emoji呢?

A:因为我们UTF-8编码可能是2或3或4个字节,但mysql中的utf8是3个字节,存放一个emoji是需要4个字节的,自然不够。

Mysql数据库在5.5.3之后开始支持utf8mb4字符集,所以mysql版本是5.5.3+的都可以设置让数据库存储Emoji表情

所以如果你的应用有移动端的,最好一开始设计数据库的时候就使用utf8mb4字符集

解决方案:

方案一: 过滤字符串中的emoji

方案二: 转译emoji后入库。获取时反转译成emoji使用

//转译emoji
URLEncoder.encode(含有emoji的数据, "UTF-8");
//反转译成emoji<br/>
URLDecoder.decode(经过转义的数据, "UTF-8");

另外再推荐一款emoji转义工具

注意点:emoji转译后可以入库。但当用户就是输入的内容本身就是【转译后的内容】
此时从库中反转译时就变成了emoji。这就造成跟用户输入不一致的情况

方案三: 修改数据库配置,实现可存储emoji

目前网上给的解决方案普遍都是:修改该字段或者该张表的编码方式为utf8mb4

但仅这么处理是并不起作用。

还需要执行SET NAMES utf8mb4; 将整个库的 character_set_client、character_set_connection、character_set_results等值修改为utf8mb4才会起作用

修改已经建立表的字符集alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;

注意点:新建数据库时可以进行初始化设置,但是已有的线上生产库进行此操作有风险,因此建议使用相关类库转义后进行存储和显示

使用下列SQL语句可以查看MySQL中character_set相关变量:
SHOW VARIABLES LIKE '%char%';

------The End------

感谢大家看到最后,文章持续更新!欢迎大家指出我的文章的不足之处,也欢迎大家关注、收藏+分享

如果这个办法对您有用,或者您希望持续关注,可以在微信公众号中搜索【码路无涯】,期待你的到来

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容