emoji图标传情达意不二选择。而且使用label显示emoji非常简单,和显示一般的字符串没有任何区别。
但是,在开发中我遇到了这样的需求 —— 限制评论行数最多为3行。众所周知,用户评论中有很多的 emoji ,而且各个是争奇斗艳。原本我以为,限定行数轻松加愉快,然而后来变成一场爬坑行动。
我一开始是这样做的:设定label的numberofline为3,然后设置 linebreakmode为middle。这是最常见的设置了。然后问题来了,在iOS上没有问题,但是在iOS 7上出现了崩溃。原因是:
由于项目中使用了 realm 所以开到有形似 _ZNK5realm6ColumnIdE7averageEmmmPm 这样的log。。。
之后调查原因,结果问题是出在 emoji 上。label 所谓的 linebreak 实质上是把字符截断,而后加上... 。这个过程本来没什么问题,但问题是 如果要截断的是emoji就会出现崩溃。我总结是因为,emoji 的utf8 编码。中文的utf8编码是一个字两个字符,英文的话,是一个字母对应一个utf8码。但是,emoji图标的utf8编码是不固定的,有可能是一个emoji对应的utf8编码是2个字符,有可能是3个,有可能是4个,等等。
所以,在截断这些emoji的时候,Apple是怎么做的?他是按照utf8编码来截断的吗?如果是的话,因为字符串在展示前都是以utf8编码存在的,会不会出现这样的情况 —— label吧一个 又4个utf编码组成的 emoji 图标的 前两位截断了,而后两位还存在。这样一来,这个emoji就被破坏了,导致显示的时候label无法正常显示而崩溃了。
本着这样的想法,我过滤了字符串中的emoji。结果是label不在崩溃了。虽然,我不是很确定label截断的字符的实现,但是去除 emoji 后截断字符串显示结果是正常的。
对于这个问题,iOS 7 系列的系统全部会崩溃,而 iOS 8 部分系统中修复了这个问题,到了 iOS 9.2 有是大面积崩溃。最后我决定,不管什么系统,一律过滤掉 emoji 图标。
附上过滤 emoji 图标的方法:
NSMutableArray *emojiRangesArray = [NSMutableArray array];
[originString enumerateSubstringsInRange:NSMakeRange(0,[originString length])
options:NSStringEnumerationByComposedCharacterSequences
usingBlock:^(NSString *substring,
NSRange substringRange,
NSRange enclosingRange,
BOOL *stop){
const unichar hs = [substring characterAtIndex:0];
// surrogate pair
if (0xd800 <= hs &&hs <= 0xdbff){
if (substring.length > 1){
const unichar ls = [substring characterAtIndex:1];
const int uc = ((hs - 0xd800) * 0x400) + (ls - 0xdc00) + 0x10000;
if (0x1d000 <= uc &&uc <= 0x1f9c0){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
}
}
else if (substring.length > 1){
const unichar ls = [substring characterAtIndex:1];
if (ls == 0x20e3 ||ls == 0xfe0f ||ls == 0xd83c){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
}
else{
// non surrogate
if (0x2100 <= hs &&hs <= 0x27ff){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
else if (0x2B05 <= hs &&hs <= 0x2b07){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
else if (0x2934 <= hs &&hs <= 0x2935){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
else if (0x3297 <= hs &&hs <= 0x3299){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
else if (hs == 0xa9 ||hs == 0xae ||hs == 0x303d ||hs == 0x3030 ||hs == 0x2b55 ||hs == 0x2b1c ||hs == 0x2b1b ||hs == 0x2b50){
[emojiRangesArray addObject:[NSValue valueWithRange:substringRange]];
}
}
}];
NSUInteger offset = 0;
for (NSValue * rangeValue in emojiRangesArray) {
NSRange range = [rangeValue rangeValue];
range.location -= offset;
offset += range.length;
originString = [originString stringByReplacingCharactersInRange:range withString:@""];
}
最后一段,使用offset 是因为把emoji替换为了@"",这样原始字符串的长度会缩短,而 range 的location值还是按照原始字符串长度来计算的,所以设置了offset这个偏移量。