根据"等同性"来比较对象是一个非常有用的功能,不过,按照"=="操作符比较出来的结果未必就是我们想要的.因为该操作是比较的两个指针本身,而不是其所指向的对象,应该使用NSObject协议中国声明的"isEqual":方法来判断两个对象的等同性.一般来说,两个类型不同的对象总是不相等的.
NSObject协议中有两个用于判断等同性的关键方法:
- (BOOL)isEqual:(id)object;
- (NSUInteger)hash;
NSObject类对这两个方法的默认实现是:当且仅当其"指针值(内存地址)"完全相等时,这两个对象才相等.若想在自定义的对象中正确覆写这些方法,就必须先理解其约定.
如果"isEqual:"方法断定两个对象相等,那么其hash方法也必须返回同一个值,但是,如果两个对象的hash方法返回同一个值,那么"isEqual:"方法未必会认为两者相等.
比如有下面这个类:
@interface CWGPerson : NSObject
@property (nonatomic, copy) NSString *firstName;
@property (nonatomic, copy) NSString *lastName;
@property (nonatomic, assign) NSUInteger age;
@end
我们认为:如果两个CWGPerson的所有字段全部相等, 那么这两个对象就相等.于是"isEqual:"方法可以写成:
- (BOOL)isEqual:(id)object {
if (self == object) return YES;
if ([self class] != [object class]) return NO;
CWGPerson *otherPerson = (CWGPerson *)object;
if (![_firstName isEqualToString:otherPerson.firstName]) return NO;
if (![_lastName isEqualToString:otherPerson.lastName]) return NO;
if (_age != otherPerson.age]) return NO;
return YES;
}
先判断两个指针是否相等,接下来判断两个对象所属的类,最后检测每个属性是否相等。
接下来该实现hash方法了,下面这种写法完全可行:
- (NSUInteger)hash {
return 1337;
}
不过这样的话,在collection中使用这种对象将产生性能问题,因为collection在检索哈希表时,会用到对象的哈希码做索引。这样的话假如集合中有10000个对象,若是继续向其中添加对象,则需要将这10000个对象全部扫描一遍。
hash方法也可以这样来实现:
- (NSUInteger)hash {
NSString *stringToHash = [NSString stringWithFormat:@"%@:%@:%i", _firstName, _lastName, _age];
return [stringToHash hash];
}
这样做将NSString对象中的熟悉都塞入另一个字符串中,然后令hash方法返回该字符串的哈希码、这样做符合约定,因为两个相等的CWGPerson对象总是返回相同的哈希码。但是这样做有额外增加了创建字符串的开销。
再来看一种方法:
- (NSUInteger)hash {
NSUInteger firstNameHash = [_firstName hash];
NSUInteger lastNameHash = [_lastName hash];
NSUInteger ageHash = _age;
return firstNameHash ^ lastNameHash ^ ageHash;
}
这种做法既能保持较高效率,又能使生成的哈希码至少位于一定范围之内,而不会过于频繁的重复。当然,此算法生成的哈希码还是会碰撞的,不过至少可以保证哈希码有多种可能的取值。编写hash方法时,应该用当前的对象做实验,以便在减少碰撞频度与降低运算复杂程度间取舍。
特定类所具有的等同性判定方法
如果经常需要判断等同性,那么可能会自己开创建等同性判定方法,因为无需检查参数类型,所以能大大提升检查速度。在编写判定方法时,也应该覆写“isEqual”方法,后者的常见实现方式为:如果受测的参数与接收该消息的对象都属于同一个类,那么就该调用自己编写的判定方法,否则就交由超类来判断。
例如,在CWGPerson类中可以竖线如下两个方法:
- (BOOL)isEqualToPerson:(CWGPerson *)otherPerson {
if (self == object) return YES;
if (![_firstName isEqualToString:otherPerson.firstName]) return NO;
if (![_lastName isEqualToString:otherPerson.lastName]) return NO;
if (_age != otherPerson.age]) return NO;
return YES;
}
- (BOOL)isEqual:(id)object {
if ([self class] == [object class]) {
return [self isEqualToPerson:(CWGPerson *)object];
} else {
return [super isEqual:object];
}
}
等同性判定的执行深度
创建等同性判定方法时,一定要根据整个对象来判断等同性,还是仅仅根据其中几个字段来判断。NSArray的检测方式为先看看两个数组所含对象个数是否相同,若是相同的,则在每个对应位子的两个对象身上调用“isEqual”方法,这叫“深度等同性判定”。不过有时没有必要这么做,比如说:我们假设CWGPerson类的实例是根据数据库中的数据创建出来的,那么其中就可能还有有个属性叫做“主键”。在这样的情况下,我们只要根据主键来判断就行了。
容器中可变类的等同性
在这里我们举个例子就能很好的理解这点:
NSMutableSet *set = [NSMutableSet new];
NSMutableArray *arrayA = [@[@1, @2] mutableCopy];
[set addObject: arrayA];
NSLog(@"set = %@", set);
// Output: set = {(1, 2)}
如果这时,再向set中加入一个数组, 此数组与前面的数组一模一样。那么:
NSMutableArray *arrayB = [@[@1, @2] mutableCopy];
[set addObject: arrayB];
NSLog(@"set = %@", set);
// Output: set = {(1, 2)}
此时set里仍然只有一个对象,因为刚才要加入的那个数组对象和set中也有的数组对象相等,所以set并没有改变。但是如果我们添加的是一个不一样的数组:
NSMutableArray *arrayC = [@[@1] mutableCopy];
[set addObject: arrayC];
NSLog(@"set = %@", set);
// Output: set = {((1), (1, 2))}
然而这时,我们进行如下操作:
[arrayC addObject:@2];
NSLog(@"set = %@", set);
// Output: set = {((1, 2), (1, 2))}
set中居然有2个相等的数组,根据set的语法规则,这时绝对不允许出现的。然而现在却无法保证这一点了,因为我们修改了set中已有的对象,若是拷贝此set,那就更可怕了:
NSSet *setB = [set copy];
NSLog(@"set = %@", set);
// Output: set = {(1, 2)}
复制之后又只剩下一个对象了,此set看上去好像是由一个空set开始,通过逐个向其中添加新对象而创建出来的。这可能符合你的要求,也可能不符合,有的开发者也许想要忽略set中的错误,“找原样”复制一个新的出来,还有的开发者则会认为这样做挺好的。其实这两种拷贝算法都说得通,于是就进一步印证了刚才说的那个问题:如果把某个对象放入set之后又修改其内容,那么后面的行为就很难预料。
举这个例子是为了提醒大家,把某个对象放入collection之后改变其内容将会造成什么后果。笔者并不是说绝对不能这么做,而是要提醒你这样做的隐患,用相印的代码处理可能发生的问题。
总结:
- 若是检测对象的等同性,请提供“isEqual:”和“hash”方法
- 相同的对象必须具有相同的哈希码,但是两个哈希码相同的对象却未必相同。
- 不要盲目的这个检测每条属性,二手应该依照具体需求来制定检测方案。
- 编写hash方法时,应该使用计算速度快而且哈希码碰撞几率低的算法。