最近在读《Effective Java》里面有很著名的一个重写equals和hashcode的论断。并介绍了重写的原则。今天我来说一下面试题中经常出现但是我们一般理解不够深刻的”=“、”equals“、”hsahcode“区别和联系。
基本概念
1 “==”
在java中“==”是用来比较变量值是否相等。如果是基本类型,直接比较值。如果是对象类型,比较的是两个对象的引用,也就是地址。对象是放在堆中的,栈中存放的是对象的引用。“==”是对栈中的值进行比较的。
2 “equals”
我们都知道java所有的类都是集成自Object类,Object里有一个方法“equals”,这个方法是用来比较两个对象是否相等的。在Object类中有这样的代码:
public boolean equals(Object o) {
return this == o;
}
说明在Object里"equals"和"=="是一回事。
3 “hashcode”
在Object里提供了hashcode这个方法。要说hashcode就得说java集合。java有的集合是不能重复的,所以需要用equeals判断集合中元素是否是同一个。但是如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。可以说hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。
关系
首先说“==”和“equals”。
先明白一个事情:如果类没有重写equals,那么对于该类的对象来说“==”和“equals”没有区别。都是比较对象的内存地址。 但在一些类库当中这个方法被覆盖掉了,如String,Integer,Date在这些类当中equals有其自身的实现,而不再是比较类在堆内存中的存放地址了。所以会有很多经典的面试题:
String a = new String ("abc");
String b = new String ("abc");
System.out.println(a.equals(b));
System.out.println(a==b);
结果大家都知道 是true和false,其实这才是特殊情况。并不能得出一般的结论而笼统的说:”equals比较对象值,'=='比较地址“。要看是否重写了equals方法。再说equals和hashCode之间的关系。首先hashCode存在就是为了提高效率并且辅助equals的,一般重写equals要同时重写hashCode。java中这样规定他们的关系:1、如果两个对象相同,那么它们的hashCode值一定要相同;2、如果两个对象的hashCode相同,它们并不一定相同 ,上面说的对象相同指的是用eqauls方法比较。反过来:hashcode()不等,一定能推出equals()也不等;hashcode()相等,equals()可能相等,也可能不等。 如果重写这两个方法最好遵循以上原则。所以比较两者还要看具体是如何重写的。
特殊情况
说一种特殊情况:
String s1 = "Lpnpcs";
String s2 = "Lpnpcs";
if (s1 == s2) {
System.out.println("s1 == s2");
} else{
System.out.println("s1 != s2");
}输出s1==s2;
String s1 = "Lpnpcs";
String s2 = new String("Lpnpcs");
if (s1 == s2)
{System.out.println("s1 == s2");}
else
{System.out.println("s1 != s2");}
if (s1.equals(s2)) {System.out.println("s1 equals s2");}
else{
System.out.println("s1 not equals s2");
}
输出s1 != s2 s1 equals s2说明:s1 s2分别引用了两个"Lpnpcs"String对象。这是什么情况? 这是由于java中对于字符串定义了一个字符串缓冲池,程序在运行的时候会创建一个字符串缓冲池当使用 s2 = "Lpnpcs" 这样的表达是创建字符串的时候,程序首先会在这个String缓冲池中寻找相同值的对象,在第一个程序中,s1先被放到了池中,所以在s2被创建的时候,程序找到了具有相同值的 s1将s2引用s1所引用的对象"Lpnpcs"。第二段程序中,使用了 new 操作符,他明白的告诉程序:"我需要新建一个新的"于是一个新的"Lpnpcs"String对象被创建在内存中。他们的值相同,但是位置不同。所以可见java定义这个缓冲池就是为了节约资源。我们在用字符串的时候 尽量采用 :String a =“”;这种形式。以上就是他们的实现和原理,相信现在应该很清楚了。