HashSet与TreeSet浅析

HashSet与TreeSet浅析

标签(空格分隔): java


今天来讲讲学到的Java Collection里两种数据结构:TreeSet与HashSet。

一. 区别:

HastSet使用散列表进行存储,元素无序,允许为null
TreeSet是使用树结构来进行存储,元素按字符串顺序排序存储,元素不允许为null

代码演示:

//HashSet
Set set1 = new HashSet();
set1.add("first");
set1.add("second");
set1.add("third");
System.out.println(set1);
//输出结果:[third, first, second]

//TreeSet
Set set2 = new TreeSet();
set2.add("first");
set2.add("second");
set2.add("third");
set2.add("forth");
System.out.println(set2);
//输出结果:[first,forth, second, third]

二. 有关对象的比较:

相较于List,Set没有序列的概念,正如我们所学到的集合,具有非重复性。来看下列代码:

//set is not sequencial,doesn't have positiion
List list = new ArrayList();
list.add(123);
list.add(123);
//about hashSet
Set set1 = new HashSet();
set1.add(123);
set1.add(123);//have no use
System.out.println(set1.size());
//输出结果:1

从上述代码可以看出,不能重复给HashSet加123这个整型元素,但是当我们添加的对象时,情况会有所不同。比如我们有如下这个Person类,并向HashSet中添加Person对象时:

class Person{
    int pid;
    String name;
    public Person(int pid, String name){
        super();
        this.pid = pid;
        this.name = name;
    }
}
public class Test{
    public static void main(String[], args){
        set1.add(new Person(1,"abc"));
        set1.add(new Person(1,"abc"));
        //now they are not actually the same
        System.out.println(set1.size());
        //输出结果:2
    }
}

这里之所以认为先后添加的对象不重复,是因为默认的HashCode函数不会给两个对象赋予相同的hashCode值,而hashCode值不同,则不能认定为相同对象。至于HashCode函数是什么,让我们往下看。

既然我们添加了两个属性一模一样的对象都不会被默认方法认定为重复,那有什么方法来改变这种情况呢?
大家都知道,所有的自定义类都继承于Object类,Object类中有equals方法,专门用来判断两个对象是否相等。讲到这里可能有同学会提出,我在Person类里重写一下equals方法是不是就行了呢?就像这样:

@override
    public boolean equals(object object){
        //to determine the important attribute
        Person p = (Person)object;
        return (this.pid == p.pid);
    }

这样,当两个对象的pid相等时,就认为这两个对象重复,从而不会重复添加到HashSet里了?NONONO!这里就要回到我们刚才提到过的hashCode方法了。。。。呜呜呜呜,寝室断电了,而我又是个严格作息的好孩子,明天见吧(不过睡前先喝一杯牛奶啦)。


好了,让我们继续。首先要弄明白为什么要有hashCode这个方法。试想一下,如果对于一个HashSet里的值,每尝试添加一个元素时,都要一一与已有元素作比较,调用equals方法,假设HashSet的size为n,则添加过程总共执行了$$m=1+2+3+...+n-1=(n-1)(n-2)/2$$次equals方法!这是非常耗时的,所以必须采取策略来减少equals方法的调用次数。而HashCode方法会根据对象的属性返回一个哈希码,HashSet把此哈希码转化成一个数组下标,来标记该对象的位置,如果该位置上的链表没有此元素,则代表当前HashSet中无此哈希码的对象,可以添加。如果该位置的链表里有元素,则此时通过HashCode已经无法判断这两个对象是否重复(此时成为conflict),此时再调用equals方法,进一步判断。HashCode工作原理如下:

HashCode工作原理

好了,我们知道,只有当两个对象发生conflict时,我们才调用equals方法来进行判断。那接下来让我们重载hashCode方法,完成最终的目的吧!

@override
public int hashCode(){
    final int prime = 31;  
    int result = 1;  
    result = prime * result + pid;  
    result = prime * result + ((name == null) ? 0 : name.hashCode());  
    return result;
    }

现在,简述一下完整的过程:当有新对象需要添加到HashSet中时,首先hashCode方法判断其hashCode是否已被标记,若未标记,则直接添加,否则,将其与HashSet中相同哈希码的元素用equals方法比较,最后确定是否为重复元素。
用法:一般HashCode与equals方法控制的都是同一个属性,比如,当添加Person对象时,只要其pid相同,就认为不可重复添加:

@override
class Person{
    int pid;
    String name;
    public Person(int pid, String name){
        super();
        this.pid = pid;
        this.name = name;
    }
    @override
    public boolean equals(object object){
        //to determine the important attribute
        Person p = (Person)object;
        return (this.pid == p.pid);
    }
    @override
    public int hashCode(){
        final int prime = 31;  
        int result = 1;  
        result = prime * result + pid;  //note here we choose pid as our important attribute
        return result;
    }

}

public class Test{
    public static void main(String[], args){
        Set set1 = new HashSet();

        set1.add(new Person(1,"abc"));
        set1.add(new Person(1,'abd'));//here we have oerride the hashCode() and equals(), and choose pid as important attribute.
        
        //add the second object, it depends on whether they are the same
        //but when we override the equal method of the class Person, the JVM will know how to campare the two objects,
        //if the two objects are recognized as the same, it will not add the second one.
        //and we can override the hashCode method to select some diffrent objects instead of invoking equals method many times
        
        System.out.prinln(set1.size());
        //输出结果:1
    }
}

有关HashSet的对象比较就到这里啦(好像有点啰嗦,见谅_
下面看有关TreeSet:
TreeSet采用的比较方式是实现Campare接口,并重载campareTo方法,来比较两个对象是否相等:

class Person implements Camparable{
    int pid;
    String name;
    public Person(int pid, String name){
        super();
        this.pid = pid;
        this.name = name;
    }

    @override
    public int campareTo(object o){
        //that means when their pid is the same, they are regarded as the same
        Person p = (Person)o;
        return pid-p.pid;
    }
}

方法很简单,返回负值则代表当前对象小于比较对象,其他两种情况类推。
至于TreeSet的原理,也很简单,构建一个二叉树,节点的左子树比它大,右子树它他小。当新对象进入时,对每个节点进行比较,比节点大则进入左子树...这样,至多通过log2(n)次比较就能判断元素是否重复。

三、最后

有关这两种数据结构,还有很多地方还没涉及。可能以后还会作补充,如果希望了解更多,这里给出了官方API的链接
HashSetTreeSet

第一次写笔记,也是为数不多的使用markdown,希望自己能养成习惯,这里纯粹是个人分享,如有不对或不足的地方,请多多指正!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容

  • 上一篇文章介绍了Set集合的通用知识。Set集合中包含了三个比较重要的实现类:HashSet、TreeSet和En...
    Ruheng阅读 15,635评论 3 57
  • Java8张图 11、字符串不变性 12、equals()方法、hashCode()方法的区别 13、...
    Miley_MOJIE阅读 3,698评论 0 11
  • (一)Java部分 1、列举出JAVA中6个比较常用的包【天威诚信面试题】 【参考答案】 java.lang;ja...
    独云阅读 7,094评论 0 62
  • 1.import static是Java 5增加的功能,就是将Import类中的静态方法,可以作为本类的静态方法来...
    XLsn0w阅读 1,220评论 0 2
  • 第一次画思维导图,有点紧张又有点惊喜! 画完之后,全方位立体式的仔细查看,生怕遗漏了什么东西。不知不觉中添加了很多...
    任同学的妈阅读 302评论 0 1