算法学习笔记之两个数组取交集

题目:给定两个数组,编写一个函数来计算它们的交集。

int[] arr1 = {1,1,2,3,4};
int[] arr2 = {2,3};
.
.
method(arr1,arr2);
.
.
输出:2,3

打印输出的结果。

解题思路:

取交集就是取两个数组里面的相同的元素,如果数组里面元素有重复,先去重。思路有了接下来就是代码实现了,这里先提供一种常规的写法,既然是两个数组里面的元素,那么首先想到的就是双重for循环去遍历两个数组,把相同的元素放到一个集合里面,最后对集合进行排序,然后打印数据。

private static void method1(int[] array1 ,int[] array2){
    ArrayList<Integer> listTemp = new ArrayList<>();
    for (int array1Element : array1) {
        for (int array2Element : array2) {
            if (array1Element == array2Element) {
                if (!listTemp.contains(array1Element)) {
                    listTemp.add(array1Element);
                    break;
                }
            }
        }
    }
    if (listTemp.size() == 0) {
        System.out.println("两个数组没有交集");
        return;
    }
    Collections.sort(listTemp);
    StringBuffer sb = new StringBuffer();
    for (int i : listTemp) {
        sb.append(i + ",");
    }
}

一般来说代码写到这里就可以结束了,因为功能已经实现,但是作为一个有责任的开发,肯定是要对自己写的代码的性能做测试,题主测试了一下:100个10以内的数字,方法耗时1ms,1000个10以内的数字耗时11ms,10000个10以内的数耗时398ms,所以数组的长度越大,耗时就越多,显然这样的方法不是最好的方法,那么就要分析一下耗时的原因在哪里,上log。

//通过log发现最为耗时的代码是这一区域的代码
if (!listTemp.contains(array1Element)) {
    listTemp.add(array1Element);
    break;
}               

第一感觉应该是那个contains方法比较耗时,阅读源码看看

//先是add方法
public boolean add(E e) {
    //扩容
   ensureCapacityInternal(size + 1);  // Increments modCount!!
   //赋值
   elementData[size++] = e;
   return true;
}

//contains方法调用了indexof方法
public boolean contains(Object o) {
   return indexOf(o) >= 0;
}

//indexOf方法最后也是循环遍历
public int indexOf(Object o) {
    if (o == null) {
        for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

到这里就真相大白了,add方法应该是不耗时的,耗时的还是contains方法,因为里面还有一层循环,而且集合越大,循环次数越多,时间复杂度为O(n),在加上外层的双For循环,整个函数的时间复杂度为O(n^3),所以现在需要解决的核心问题就变成:时间复杂度低的集合查询元素的方法

常见时间复杂度排序为O(1)< O(logn)< O(n)< O(n^2) 什么是时间复杂度参考这篇文章 ,ArrayList.contains()的时间复杂度为O(n),那么我们就需要一个时间复杂度为O(1)或者O(logn)的方法,我们来看看HashMap。

  • HashMap的containsValue方法
public boolean containsValue(Object value) {
    Node<K,V>[] tab; V v;
    if ((tab = table) != null && size > 0) {
        for (int i = 0; i < tab.length; ++i) {
            for (Node<K,V> e = tab[i]; e != null; e = e.next) {
                if ((v = e.value) == value ||
                    (value != null && value.equals(v)))
                    return true;
            }
        }
    }
    return false;
}

遍历数组里先得到头节点,然后再遍历链表得到value,间复杂度是O(n^2) > O(n)不满足

  • HashMap的containsKey方法
//获取HashMap里面的节点数组是否为空
public boolean containsKey(Object key) {
   return getNode(hash(key), key) != null;
}

//1)数组不为空
//2)数组长度>0
//3)通过hash计算出该元素在数组中存放位置的索引,而且该索引处数据不为空null
final HashMap.Node<K,V> getNode(int hash, Object key) {
    HashMap.Node<K,V>[] tab; HashMap.Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
        //判断该数组索引位置处第一个是否为我们要找的元素 判断条件需要满足hash 和 key 相同
        if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
            //如果第一个就是我们要找的,直接返回即可
            return first;
        //如果第一个不是,我们需要循环遍历,然后找数据
        if ((e = first.next) != null) {
            //如果第1个的元素是红黑树类型的节点
            if (first instanceof HashMap.TreeNode)
                //那我们需要调用红黑树的方法查找节点
                return ((HashMap.TreeNode<K,V>)first).getTreeNode(hash, key);
            //如果不是,则该为链表,需要遍历查找
            do {
                //循环判断下一个节点的hash和key是否相同
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    //没找到返回Null
    return null;
}

可以看出要么第一个索引直接命中时间复杂度为O(1),如果没有命中则遍历红黑树的节点,遍历红黑树的节点时间复杂度为O(lgn),也就是说时间复杂度最大是O(lgn)最小是O(1),都比O(n)要小,所以这个是能满足条件。关于HashMap的containsKey的时间复杂度的解释可以参考这篇文章

  • 围绕HashMap的ContainsKey方法,思考代码编写思路:
    1. 单个数组去重放入新的容器
    2. 拿新的容器对比另一个数组找出相同的元素
    3. 得到的所有相同的元素就是交集部分
private static void method2(int[] array1 ,int[] array2){
    long start = System.currentTimeMillis();
    HashMap<Integer,Boolean> map = new HashMap<>();
    //单个数组去重,放入新的容器,并且给每一个元素打上一个boolean标记false。
    for (int array1Element :array1 ) {
        if (!map.containsKey(array1Element)) {
            map.put(array1Element,false);
        }
     }
     //拿上新的容器去跟另一个数组比较,如果新的容器里面有相同的Key,就说明是交集元素,打上另一个boolean标记true。
     for (int array2Element :array2 ) {
        if (map.containsKey(array2Element)) {
            map.put(array2Element,true);
        }
      } 
      StringBuffer sb = new StringBuffer();
      //遍历新的容器,找出boolean标记为true所对应的键,就是交集元素了
      for (Map.Entry<Integer,Boolean> e : map.entrySet() ) {
        if (e.getValue().equals(true)) {
            sb.append(e.getKey()+",");
        }    
      }
      long end = System.currentTimeMillis();
      System.out.println("method2 两个数组的交集为:" + sb.toString() + "耗时 = " + (end - start)+ "ms");
}

测试结果:100个10以内的数字,方法耗时1ms,1000个10以内的数字耗时2ms,10000个10以内的数耗时5ms

大家如果还有更优算法,欢迎下方欢迎留言,大家一起探讨~~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354