微信昵称emoji表情的过滤

前言

微信昵称现在五花八门,可以加入各种表情符号。这些符号存储到mysql数据库时存在一些问题。这里记录下我的解决方法。

问题

  • 第一种方案:修改数据库编码,支持存储emoji表情

mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情
但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。

数据库字符优先级有:系统级、数据库级、表级、字段。这5个优先级中字段优先级最高

系统级需要修改mysql配置文件,我没尝试。下面提供修改库级和表级。

如果你的数据库还没有发布或者数据较少,建议重新创建,在创建的时候会指定编码。


image.png

如果数据库已经发布,则执行下面的sql

alter database <数据库名> character set utf8mb4;
alter table <表名> CONVERT TO CHARACTER SET utf8mb4;
  • 第二种方案: 过滤emoji表情,不插入数据库。

例如java版本如下。
该类库提供了很多功能,如果只需要过滤则只需要 调用 removeAllEmojis 即可。

  <dependency>
            <groupId>com.vdurmont</groupId>
            <artifactId>emoji-java</artifactId>
            <version>4.0.0</version>
        </dependency>
public static void main(String[] args){
        System.out.println(EmojiParser.parseToAliases("胖飞的幸福时光\uD83E\uDD14"));
        System.out.println(EmojiParser.parseToHtmlDecimal("胖飞的幸福时光\uD83E\uDD14"));
        System.out.println(EmojiParser.parseToUnicode("胖飞的幸福时光\uD83E\uDD14"));
        System.out.println(EmojiParser.parseToHtmlHexadecimal("胖飞的幸福时光\uD83E\uDD14"));
        System.out.println(EmojiParser.removeAllEmojis("胖飞的幸福时光\uD83E\uDD14"));
}
image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • MYSQL 基础知识 1 MySQL数据库概要 2 简单MySQL环境 3 数据的存储和获取 4 MySQL基本操...
    Kingtester阅读 7,857评论 5 116
  • 先补习一下Unicode 与 UTF-8的历史演变过程 http://www.jianshu.com/p/ab0d...
    爱蛇阅读 2,898评论 0 1
  • https://my.oschina.net/wingyiu/blog/153357 MYSQL 5.5 之前, ...
    爱蛇阅读 2,765评论 0 0
  • 网站seo是一个长期的事情 1、去利用站长工具查关键词的排名 关键词排名下降,网站权重下降;收录就下降,流量就下降...
    卡卡003阅读 268评论 0 0
  • 这是我第四次军训了,在这之前的前几天我还军训了一次,因为转校的缘故,又要军训,因为军训像以前那个教官那样好我们女...
    泡面妹181阅读 408评论 0 7