继续这道google题目,大神在人间。。。
文字版:
一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,
找到至少一个重复元素,要求O(1)空间和O(n)时间。
解法:叫做符号位标志法。
int Repeat(int *a, int n)
{
for(int i = 0; i < n; i++)
{
if(a[i] > 0) //判断条件
{
if(a[ a[i] ] < 0)
{
return a[i];//已经被标上负值了,有重复
}
else
{
a[ a[i] ]= -a[a[i]]; //记为负
}
}
else // 此时|a[i]|代表的值已经出现过一次了
{
if(a[-a[i]] < 0)
{
return -a[i];//有重复找到
}
else
{
a[ -a[i] ] = -a[ -a[i] ];
}
}
}
return -1;//数组中没有重复的数
}
下面对这种以取负为访问标志的方法用个实例来说明下:
设int a[] = {1, 2, 1}
第一步:由于a[0]等于1大于0,因此先判断下a[a[0]]即a[1]是否小于0,如果小于,说明这是第二次访问下标为1的元素,表明我们已经找到了重复元素。不是则将a[a[0]]取负,a[1]=-a[1]=-2。
第二步:由于a[1]等于-2,因此先判断下a[-a[1]]取出a[2]是否小于0,如果小于,说明这是第二次访问下标为2的元素,表明我们已经找到了重复元素。不是则将a[-a[1]]取负,a[2]=-a[2]=-1。
第三步:由于a[2]等于-1,因此判断下a[-a[2]]即a[1]是否小于0,由于a[1]在第一步中被取反过了,因此证明这是第二次访问下标为1的元素,直接返回-a[2]即可。
这种通过取负来判断元素是否重复访问的方法正如网友jwfeng002所言,当数组第0个元素为0且数据中只有0重复时是无法找出正确解的。只要用:
const int MAXN = 5;
int a[MAXN] = {0, 1, 2, 3, 0};
这组数据来测试,就会发现该方法无法判断0是个重复出现的元素。运行结果如下图所示:
注:其实可以对0进行标记,专门处理为0的时候的重复情况。
这个算法虽然有缺陷,但我们可以沿着这个算法的思路——这个算法之所以用到了取负,是因此根据题目条件,数组中数据范围为[0,n-1],因此可以通过判断元素是否大于0来决定这个元素是未访问过的数据还是已访问过的数据。但也正因为对0的取负是无效操作决定了这个算法存在着缺陷。要改进一下也很简单——不用取负,而用加n。这样通过判断元素是否大于等于n就能决定这个元素是未访问过的数据还是已访问过的数据。完整代码如下:
//GOOGLE面试题
//一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。
#include <stdio.h>
const int NO_REPEAT_FLAG = -1;
int FindRepeatNumberInArray(int *a, int n)
{
for(int i = 0; i < n; i++)
{
int nRealIndex = a[i] >= n ? a[i] - n : a[i];
if (a[nRealIndex] >= n) //这个位置上的值大于n说明已经是第二次访问这个位置了
return nRealIndex;
else
a[nRealIndex] += n;
}
return NO_REPEAT_FLAG; //数组中没有重复的数
}
void PrintfArray(int a[], int n)
{
for (int i = 0; i < n; i++)
printf("%d ", a[i]);
putchar('\n');
}
int main()
{
const int MAXN = 10;
//int a[MAXN] = {2, 4, 1, 5, 7, 6, 1, 9, 0, 2};
int a[MAXN] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 0};
printf("数组为: \n");
PrintfArray(a, MAXN);
int nRepeatNumber = FindRepeatNumberInArray(a, MAXN);
if (nRepeatNumber != NO_REPEAT_FLAG)
printf("该数组有重复元素,此元素为%d\n", nRepeatNumber);
else
printf("该数组没有重复元素\n");
return 0;
}
运行结果如图所示:
推荐阅读:
经典算法应用之一----归并排序(微软笔试题)
经典算法应用之二----基数排序(google笔试题)
经典算法应用之三----应用二中题目的升华
经典算法应用之四(上)---基本位操作之算法篇
经典算法应用之四(中)---基本位操作之算法篇
经典算法应用之四(下)---百度面试题
经典算法应用之五---随机生成和为S的N个正整数
经典算法应用之六---过桥问题和过河问题
经典算法应用之七----10亿数据中取最大的100个数据