经典算法应用之二----基数排序(google笔试题)

最近在微博上看到一道有趣的GOOGLE面试题,见下图:

文字版:

一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,
找到至少一个重复元素,要求O(1)空间和O(n)时间。

这个题目要求用O(n)的时间复杂度,这意味着只能遍历数组一次。同时还要寻找重复元素,很容易想到建立哈希表来完成,遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。因此直接使用C++ STL中的hash_set(参见《STL系列之六 set与hash_set》)可以方便的在O(n)时间内完成对重复元素的查找。
但是题目却在空间复杂度上有限制——要求为O(1)的空间。因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。而基数排序的时间空间复杂度刚好符合题目要求!因此尝试使用基数排序来解这道面试题。

下面以2,4,1,5,7,6,1,9,0,2这十个数为例,展示下如何用基数排序来查找重复元素。

下标 0 1 2 3 4 5 6 7 8 9
数据 2 4 1 5 7 6 1 9 0 2

(1)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2]得:

下标 0 1 2 3 4 5 6 7 8 9
数据 1 4 2 5 7 6 1 9 0 2

(2)由于第0个元素a[0] 等于1不为0,故交换a[0]与a[a[0]]即交换a[0]与a[1]得:

下标 0 1 2 3 4 5 6 7 8 9
数据 4 1 2 5 7 6 1 9 0 2

(3)由于第0个元素a[0] 等于4不为0,故交换a[0]与a[a[0]]即交换a[0]与a[4]得:

下标 0 1 2 3 4 5 6 7 8 9
数据 7 1 2 5 4 6 1 9 0 2

(4)由于第0个元素a[0] 等于7不为0,故交换a[0]与a[a[0]]即交换a[0]与a[7]得:

下标 0 1 2 3 4 5 6 7 8 9
数据 9 1 2 5 4 6 1 7 0 2

(5)由于第0个元素a[0] 等于9不为0,故交换a[0]与a[a[0]]即交换a[0]与a[9]得:

下标 0 1 2 3 4 5 6 7 8 9
数据 2 1 2 5 4 6 1 7 0 9

(6)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2],但a[2]也为2与a[0]相等,因此我们就找到了一个重复的元素——2。

下标 0 1 2 3 4 5 6 7 8 9
数据 2 1 2 5 4 6 1 7 0 9

有了上面的分析,代码不难写出:

//GOOGLE面试题  
//一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。  
#include <stdio.h>    
const int NO_REPEAT_FLAG = -1;  
void Swap(int &x, int &y)  
{  
    int t = x;  
    x = y;  
    y = t;  
}  
//类似于基数排序,找出数组中第一个重复元素。  
int RadixSort(int a[], int n)  
{  
    int i;  
    for (i = 0; i < n; i++)  
    {  
        while (i != a[i])  
        {  
            if (a[i] == a[a[i]])  
                return a[i];  
            Swap(a[i], a[a[i]]);  
        }  
    }  
    return NO_REPEAT_FLAG;  
}  
void PrintfArray(int a[], int n)  
{  
    for (int i = 0; i < n; i++)  
        printf("%d ", a[i]);  
    putchar('\n');  
}  
int main()  
{  
    const int MAXN = 10;  
    int a[MAXN] = {2, 4, 1, 5, 7,  6, 1, 9, 0, 2};  
    //int a[MAXN] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};  
  
    printf("数组为: \n");  
    PrintfArray(a, MAXN);  
  
    int nRepeatNumber = RadixSort(a, MAXN);  
    if (nRepeatNumber != NO_REPEAT_FLAG)  
        printf("该数组有重复元素,此元素为%d\n", nRepeatNumber);  
    else  
        printf("该数组没有重复元素\n");  
    return 0;  
}  

运行结果如下图所示:

整个程序的核心代码只有短短5行左右,虽然有二重循环语句,但每个元素只会被访问一次,完成符合题目对时间复杂度的要求。


推荐阅读:
经典算法应用之一----归并排序(微软笔试题)
经典算法应用之二----基数排序(google笔试题)
经典算法应用之三----应用二中题目的升华
经典算法应用之四(上)---基本位操作之算法篇
经典算法应用之四(中)---基本位操作之算法篇
经典算法应用之四(下)---百度面试题
经典算法应用之五---随机生成和为S的N个正整数
经典算法应用之六---过桥问题和过河问题
经典算法应用之七----10亿数据中取最大的100个数据

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 10,601评论 0 52
  • Ba la la la ~ 读者朋友们,你们好啊,又到了冷锋时间,话不多说,发车! 1.冒泡排序(Bub...
    王饱饱阅读 5,779评论 0 7
  • 排序算法说明 (1)排序的定义:对一序列对象根据某个关键字进行排序; 输入:n个数:a1,a2,a3,…,an输出...
    BULL_DEBUG阅读 4,193评论 0 3
  • 从陌生人,到相识,从相识到相恋,从相恋都热恋,从热恋到熟悉的陌生人,爱一个人就是一生一世,一生或许很短,而这一生只...
    梦凡服饰李佳林阅读 2,790评论 0 0
  • 我想走出前世的阴影 紧拥那漫天飞舞的旅途、气运和梦境 这次人生之旅 宛如畸变的迷宫 左手深渊,右手地狱 前面天堑,...
    第五殿阅读 1,414评论 0 0

友情链接更多精彩内容