一般NSData转NSString的时候我们直接使用官方API,使用默认的解码样式就可以了
//栗子🌰
NSString *str = [[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];
但是当需要解码的Data内存在 � □ ? 这些符号的时候就会解码失败,通常这种特殊的符号直接替换为空即可,但是如果是使用的数据,那么就会出现问题,付一下解决方案:
- (NSData *)UTF8Data:(NSData *)tData{
//保存结果
NSMutableData *resData = [[NSMutableData alloc] initWithCapacity:tData.length];
//无效编码替代符号(常见 � □ ?)
NSData *replacement = [@"�" dataUsingEncoding:NSUTF8StringEncoding];
uint64_t index = 0;
const uint8_t *bytes = tData.bytes;
while (index < tData.length)
{
uint8_t len = 0;
uint8_t header = bytes[index];
//单字节
if ((header&0x80) == 0)
{
len = 1;
}
//2字节(并且不能为C0,C1)
else if ((header&0xE0) == 0xC0)
{
if (header != 0xC0 && header != 0xC1)
{
len = 2;
}
}
//3字节
else if((header&0xF0) == 0xE0)
{
len = 3;
}
//4字节(并且不能为F5,F6,F7)
else if ((header&0xF8) == 0xF0)
{
if (header != 0xF5 && header != 0xF6 && header != 0xF7)
{
len = 4;
}
}
//无法识别
if (len == 0)
{
[resData appendData:replacement];
index++;
continue;
}
//检测有效的数据长度(后面还有多少个10xxxxxx这样的字节)
uint8_t validLen = 1;
while (validLen < len && index+validLen < tData.length)
{
if ((bytes[index+validLen] & 0xC0) != 0x80)
break;
validLen++;
}
//有效字节等于编码要求的字节数表示合法,否则不合法
if (validLen == len)
{
[resData appendBytes:bytes+index length:len];
}else
{
[resData appendData:replacement];
}
//移动下标
index += validLen;
}
return resData;
}
使用:
// data: 原始数据源
NSData * tData = [self UTF8Data: data];//存在不规则的数据 � 强制还原这个符号
NSString *str = [[NSString alloc] initWithData: tData encoding:NSUTF8StringEncoding];
原文转自:
https://my.oschina.net/u/1763048/blog/736460
稍微做了修复,原地址内携带了私有变量,给予正确的赋值.