截取emoji表情符

工作中遇到一个问题：为保护用户隐私在评论区将用户名中间的字段使用*号代替
有的奇葩用户名中夹杂有表情字符，此时使用substring()进行截取操作，结果就有可能是乱码或者不符合要求因为JVM运行时使用UTF-16编码，实际Java自带特殊字符截取的方法offsetByCodePoints

例如String 类型的字符串是一组表情，现在要将他进行一下操作:

String emoji="🐷👀🎈😍📌";

获取表情个数

codePointCount方法返回整个String中的表情个数，此时codePointCount=5

int codePointCount = emoji.codePointCount(0, emoji.length()); //返回指定文本中的Unicode代码点数

截取最后一个表情

sta=4 ，end=5
从第4个开始(不包括) 截取到第5个(包括)
确定截取的位置后，再使用substring截取

int sta =emoji.offsetByCodePoints(0 , codePointCount-1);//获取倒数第2个表情结束的位置(实际也是倒数第一个表情开始的位置)
int end =emoji.offsetByCodePoints(0 , codePointCount); //获取最后一个表情结束的位置

String subEmoji = emoji.substring(sta, end);    //subEmoji=📌

如果截取第一个，开始的位置为offsetByCodePoints(0 , 0); 结束为offsetByCodePoints(0 ,1);

中间三个用***代替

int repSta =emoji.offsetByCodePoints(0 , 1);//不包括第一个表情
int repEnd =emoji.offsetByCodePoints(0 , 4); //范围取第234个

StringBuffer buffer = new StringBuffer(emoji);
buffer.replace(repSta , repEnd , "***");
System.out.println(" buffer="+buffer.toString());   //buffer=🐷****📌

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

截取emoji表情符

截取emoji表情符

获取表情个数

截取最后一个表情

中间三个用***代替

推荐阅读更多精彩内容

友情链接更多精彩内容