时间: 2021年2月24日星期三 晴
前言
面试是类似演讲演说的过程,网上的资料都是文字的,没法让面试者直观的体验到面试过程,本人已经将相关内容制作成音频节目,我还没有权限在简书发表音频,有兴趣的朋友可以去喜马拉雅搜索《2020年Java面试208题》收听音频版节目。
《2020年Java面试208题》整理了208个Java程序员的面试题,主要是针对三年以内开发经验的JAVA程序员提出的问题。
题目
这一期要说的是《2020年Java面试208题》的第3题,面试官提了这样一个问题:两个对象的hashCode相同,是否equals也一定为true,为什么?
知识点解析
1 散列表
这个问题里面涉及到一个散列表的概念,我先给解释一下:我们举个例子,图书馆里有100万本书,堆放在一个大仓库里,摆放的倒是整整齐齐的,但是没有做分类管理,有人要找书的话流程是这样的,说出书的名字、作者这些信息,然后在大仓库里面一本本的找,可以想象这个任务是多么的艰巨而乏味。怎么解决这个问题呢?
办法1:管理员把图书按照类型、年代、书名首字母做了一个分类,每次找书可以直接到那个分类下,根据书名首字母进行查找,范围一下缩小到不到1万本书里面去查找了。
办法2:管理员按照书名拼音全拼的顺序来摆放图书,找图书的时候,比如《钢铁是怎么炼成的》这本书,拼音是gangtieshizenyanglianchengde,只要找到g区、再找a字母、再找n字母,很快就找到了。
办法3:后来管理员又想了一个办法,把书名字符串计算为一个整数,然后每个整数做一个小盒子,然后把图书放入对应的小盒子里面,这样每个小盒子里面都只放了1本书,最多两三本。之后管理员把小盒子按从小到大的顺序摆放。这样每次找书的时候只要计算一下书名对应的整数,然后在仓库里找到对应位置的盒子,就很快找到了。
默认情况下的方式,就是傻傻的一本本的比对,恐怕现实中谁都不会这么做,但在计算机编程的时候,很多初级程序员都是这么写的,就是循环查找比对。
第1种办法基本现在图书馆都是基于这个思路来管理的,这种按照类型、年代、书名首字母这样方式分类的在现实世界里容易操作。
第2种方法其实在现实世界里没有人会这么操作,但作为计算机中的管理就是一个不错的方法了,但编码过程存在复杂性,毕竟计算拼音的过程就比较麻烦。
第3种方法中,将字符串的书名全部计算为一个整数,然后做成一个个的小盒子顺序排放,这种方式在计算机中被大量的使用,这就叫散列表。为啥叫散列呢?因为这样的书名计算结果一定不是一个挨着一个的顺序数字,而是中间会空出很多数字,在数学形式上是非连续的,术语叫离散的,因此表示成离散的、形成顺序的列,就叫散列表。
比如Java中的HashMap,总是说HashMap查询速度快,根本原因就是因为HashMap中的内容是按照第3种方法排放的。在HashMap中排放书的话之前已经解释过了,用书名计算出一个整数就行了,但是HashMap的key是支持各种各样的类的,这个整数的计算咋处理呢?Java就提供了一个hashCode方法,程序员根据自己设计的类的需要,想咋实现咋实现,只要最后计算出一个相对离散的整数就可以了。
这下相信你已经理解hashCode方法的设计目的了。
equals方法也是完全自定义的方法,由程序员自行实现,当然Java提供的类是由Sun公司或Oracle公司的程序员实现的equals方法。这个方法的设计目的是只要两个对象中的值有一点儿不相同,返回就是false,只有两个对象中的值完全一样才会返回true。
对于hashCode和equals方法的功能解释完了,接下来就由我来演示一下面试:
演示面试
你好,面试官。
1 我先说答案,hashCode相同,equals方法不一定为true。
2 在解释为什么之前,我先说一下hashCode方法和equals方法的定义。
我先说说hashCode方法,这个方法是Object类提供的,所有的类都重写了这个方法,这个方法的目的是计算出对象的散列码。这个不同类型对象的hashCode方法的实现是不一样的,比如整型对象,就是直接拿到整数对象的值作为散列码,那么就可以知道了,值不相同的整型对象hashCode也不相同,值相同的整型对象hashCode也一样。
浮点数是将浮点数值计算为唯一的整型作为散列码,因此浮点数的hashCode也不会重复。
Double类型的对象的hashCode的计算方法是将double值计算为长整型,然后只取高位的32位的整型,因为Double类型在内存中占64位,可以直接转换为唯一的Long长整型,因为长整型也是64位的。但hashCode只能返回32位的整型,因此Double类型计算出64位的长整型后,将这个长整型再舍弃一部分只保留高位的32位的整型作为散列码。
通过这样的描述可以看出,整型Integer的hashCode一定不会重复,浮点数Float的hashCode也不会重复,但Double类型的hashCode很多时候都会重复,因为总共有可能有2的64次方个数字,最后只允许生成2的32次方个散列码,那其中一定有大量的重复。
其实不用这么复杂的分析,简单的想象一下就能得到值不相同的对象的hashCode值是有可能相同的,因为hashCode的返回值是整型的,也就是说hashCode的返回值的可能性只有2的32次方个整数那么多,而现实中各种类型的数据的值绝对不只有这么少。
对于equals的定义是值不相同的对象,equals方法一定为False。
所以,可以得出结论两个对象的hashCode相同,equals不一定为true。
3 hashCode方法设计出来本来就不是追求唯一性的,而是作为散列表的散列码生成算法的,只要分散够均匀就行了。
好了,以上就是我的演示面试,不知道是否让你满意。
自我点评:
本题目依旧是明知跑题也要跑题,但跑的又不是很远,目的就是尽量多讲一些时间,你讲的多多的,让面试官讲的少少的,你就是赢家了。美国参议院有一种制度,当议员对某项议题存在不同意见的时候,允许议员在国会议事厅发表演讲阐述自己的观点,只要议员能讲,就可以一直讲下去,但不允许吃东西、喝水、睡觉,也不允许上厕所,也不允许坐着,当然也不能停下来不说,有的州甚至不限制讲演内容,议员甚至可以在台上念整本的圣经,这种制度的英文是filibuster,音译成中文叫费力把事拖。程序员面试的时候也可以采用这样的战术。
另外,在讲解的时候先切入主题,把自己的观点先表达清楚,然后再层层剖析,这样回答问题条例会更清晰。
下期再见
本人技术有限,凭借热情希望给程序员面试提供一点帮助,必有不足之处,希望业内人士积极批评指正,在留言区留言就是对我最大的鼓励。希望批评中肯一些,不要存在人身攻击,更不要波及到家人,善意中肯的批评我都能够虚心接受。 我们下期再见。