emoji表情存储

近期做朋友圈功能的时候,需要支持emoji表情评论存储。有两种方式:1.修改mysql数据字符集;2.java过滤过滤emoji表情,进行转码,之后在存入数据库;

1.修改mysql数据字符集

mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。所以把数据库编码改成utf8mb4;

修改字符集,参考:http://blog.csdn.net/u013145194/article/details/51527389

2.Java过滤过滤emoji表情,进行转码,之后在存入数据库


import org.apache.commons.lang.StringUtils;

public class EmojiUtils {

/**

* 将Unicode字符转成中文

*

* @param src

* @return

*/

public static String unicode2Emoji(String src) {

if (StringUtils.isEmpty(src)) {

return "";

}

StringBuffer retBuf = new StringBuffer();

int maxLoop = src.length();

for (int i = 0; i < maxLoop; i++) {

if (src.charAt(i) == '\\') {

if ((i < maxLoop - 5) && ((src.charAt(i + 1) == 'u')

|| (src.charAt(i + 1) == 'U'))) {

try {

retBuf.append((char) Integer

.parseInt(src.substring(i + 2, i + 6), 16));

i += 5;

} catch (NumberFormatException localNumberFormatException) {

retBuf.append(src.charAt(i));

}

} else {

retBuf.append(src.charAt(i));

}

} else {

retBuf.append(src.charAt(i));

}

}

return retBuf.toString();

}

/**

* 将字符串中的Emoji表情转换成Unicode编码

*

* @param src

* @return

*/

public static String emoji2Unicode(String src) {

StringBuffer unicode = new StringBuffer();

for (int i = 0; i < src.length(); i++) {

char c = src.charAt(i);

int codepoint = src.codePointAt(i);

if (isEmojiCharacter(codepoint)) {

unicode.append("\\u").append(Integer.toHexString(c));

} else {

unicode.append(c);

}

}

return unicode.toString();

}

/**

* 判断是否包含Emoji符号

*

* @param codePoint

* @return

*/

public static boolean isEmojiCharacter(int codePoint) {

return (codePoint >= 0x2600 && codePoint <= 0x27BF) // 杂项符号与符号字体

|| codePoint == 0x303D || codePoint == 0x2049

|| codePoint == 0x203C

|| (codePoint >= 0x2000 && codePoint <= 0x200F)//

|| (codePoint >= 0x2028 && codePoint <= 0x202F)//

|| codePoint == 0x205F //

|| (codePoint >= 0x2065 && codePoint <= 0x206F)//

/* 标点符号占用区域 */

|| (codePoint >= 0x2100 && codePoint <= 0x214F)// 字母符号

|| (codePoint >= 0x2300 && codePoint <= 0x23FF)// 各种技术符号

|| (codePoint >= 0x2B00 && codePoint <= 0x2BFF)// 箭头A

|| (codePoint >= 0x2900 && codePoint <= 0x297F)// 箭头B

|| (codePoint >= 0x3200 && codePoint <= 0x32FF)// 中文符号

|| (codePoint >= 0xD800 && codePoint <= 0xDFFF)// 高低位替代符保留区域

|| (codePoint >= 0xE000 && codePoint <= 0xF8FF)// 私有保留区域

|| (codePoint >= 0xFE00 && codePoint <= 0xFE0F)// 变异选择器

|| codePoint >= 0x10000; // Plane在第二平面以上的,char都不可以存,全部都转

}

}

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,076评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,658评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,732评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,493评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,591评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,598评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,601评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,348评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,797评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,114评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,278评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,953评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,585评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,202评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,180评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,139评论 2 352

推荐阅读更多精彩内容

  • 先补习一下Unicode 与 UTF-8的历史演变过程 http://www.jianshu.com/p/ab0d...
    爱蛇阅读 2,862评论 0 1
  • 1、问题:mysql 遇到某些中文插入异常最近有同学反馈了这样一个问题: 上述语句在脚本中 load 入库的时候会...
    kanasu阅读 2,827评论 1 5
  • https://my.oschina.net/wingyiu/blog/153357 MYSQL 5.5 之前, ...
    爱蛇阅读 2,728评论 0 0
  • 电影 帕特森 :一个会写诗的公交车司机。喜欢这样的电影,缓缓的,散发着我所向往的生活的味道。 世界旦夕之间…和异次...
    encoreMiao阅读 107评论 0 0
  • 刚刚送走了L先生,还是有些不舍得的。 昨天L先生说,我回去了,可不要想我哟!我当时是怎么说的?我说我觉得好兴奋啊!...
    素白林阅读 484评论 2 7