当需要统计一个十进制数n
的二进制表示中的1
的个数时,我们通常让最低位与1
进行&
运算n&1
,然后更新n=n>>1
,直到n=0
。
今天学习一个BitCount算法——MIT Hakmem算法,注:文章中如123
表示十进制数 ,0b101/(101)2
表示二进制数,0111
表示八进制数,0x123
表示十六进制数。
1. 问题
统计32
位整形数中二进制表示时的1
的个数
2. 思路
2.1 十进制与二进制之间转换
对于一个二进制数0b1001
转换成十进制数n
:
因此想求二进制表示时有多少个1
,只需要将上述以2
为底的多项式中全部消去,剩下的多项式系数的和就是要求的1的位数。
2.2 证明
证明对任何自然数n
的N
次幂,对n-1
取模后都为1
。
证明(数学归纳法):
假设成立
于是有
又因为当k=1
时,
综上所述:对于任何非负整数N
,f成立。
2.3 问题转化
对于一个系数为{ai}
,底为n
的多项式P(N)
,
当则,将该思路带到上述二进制转时间至的以2
为底的多项式中,但是首先需要对以2
为底的多项式进行改造,
改造成以n
为底的多项式,这里n
需要满足什么条件?
我们知道,对于一个无符号整形数来说,最多有32
个1
,所以, 带入,所以.
因此我们可以取作为改造的多项式的底。
也就是将这个32
位数每6
位看做一个单位,这样就可以分成6
组,如
3. 实现
我们将6
位看做一个单位,于是新的多项式就是
ai
表示的就是一个单位里二进制1的个数,那我们现在的任务就是计算着一个单位中的二进制1
的个数是多少?
例:统计二进制数 (100101)2
中1
的个数?
最简单我们这样来计算:
设
count = &0b000001 + (a>>1)&0b000001 +(a>>2)&0b000001 +(a>>3)&0b000001 +(a>>4)&0b000001 + (a >> 5)&0b000001
我们每次让a
和二进制数0b000001
进行&
运算,得到最低位是否为1
,然后右移一位,重复计算最低位。
一个单位计算完成,其他单位可以以同样的方式并行计算,对于32位数我们使用(1000001000001000001000001000001)2和n进行&,然后右移,这里为了方便我们将该二进制数用八进制代替为010101010101
public static int bitCount(int n){
int t = (n & 010101010101)
+ ((n >>1) & 010101010101)
+ ((n >> 2) & 010101010101)
+ ((n >> 3) & 010101010101)
+ ((n >> 4) & 010101010101)
+ ((n >> 5) & 010101010101);
return t % 63;
}
4. 优化1
我们在计算一个单位(6位)时,采用每次右移1位,右移了5次,我们如果在这6位中以3位为一个单位只需要移动2次,即:
t = a & 0b001001 + (a>>1)&0b001001 + (a>>2)&0b001001;
t & 0b000111 + (t>>3)&0b000111
public static int bitCountI(int n){
int t = (n & 0b1001001001001001001001001001001)
+ ((n >> 1) & 0b1001001001001001001001001001001)
+ ((n >> 2) & 0b1001001001001001001001001001001);
t = (t + (t >> 3)) & 0b11000111000111000111000111000111;
return t % 63;
}
也可以用八进制代替二进制
0b1001001001001001001001001001001 = 011111111111
0b11000111000111000111000111000111 = 030707070707
5. 优化2
继续优化一个单位1的个数统计,我们知道(111)2转成十进制数的多项式为:
4a+2b+c,此时我们要求a+b+c,于是我们将n>>1得2a+b,n>>2得a,
于是(4a+2b+c)-(2a+b)-a=a+b+c
得:
public static int bitCountIII(int n){
int t = n
- ((n>>1) & 0b11011011011011011011011011011011)
- ((n>>2) & 0b1001001001001001001001001001001);
t = (t + (t>>3)) & 0b11000111000111000111000111000111;
}
0b11011011011011011011011011011011 = 033333333333
0b1001001001001001001001001001001 = 011111111111
0b11000111000111000111000111000111 = 030707070707