Java二进制与运算符知识

经常看到一些Java源码和一些开源算法中常用到|、&、||、&&、>>、<<、>>>这样的符号，一开始的时候对于这些符号也是一知半解的，我们经常用到的也就只是||和&&，那么那么多的符号都具体是什么作用呢？

上述符号中，有一部分是位运算符，要了解位运算符就需要先了解二进制的相关东西，所以我们这次记录、测试一下二进制在计算机的存储方式，以及这些符号的具体作用。

二进制

我们生活中用到的是十进制的计算方法，也就是0123456789，但是计算机中识别的内容都是二进制的，只有0和1。这个知识点是一个程序常识，我们也知道以下知识点：

int类型4个字节42位，值范围是-2147483648～2147483647
byte类型1个字节8位，值范围是-128～127
byte类型的1计算机中表示：00000001
int 类型的1计算机中表示：00000000 00000000 00000000 00000001

深思一下，可能有以下疑问：

为什么byte和int值的范围最小和最大值的绝对值不一样？
负数在计算机中怎么表示？

想弄明白以上问题，我们要先理解一下二进制的以下概念：

原码

正数的原码：按照值类型大小换算成二进制数

负数的原码：按照值类型大小绝对值，换算成二进制数，最高位（第一位）补1（写成1）

举例：

一个int类型的4和-4的原码分别表示如下：

00000000 00000000 00000000 00000100

10000000 00000000 00000000 00000100

所以，一个每一个类型的二进制，其最高位是代表这个数的正负，0为正，1为负数。所以对于int类型，原码的表示范围就是：

11111111 11111111 11111111 11111111 ～ 011111111 11111111 11111111 11111111

-2147483647 ～2147483647

反码

反码产生的原因在于，如果在计算机中用源码的话，那么会有一个+0和-0，，同时在进行正负数相加或者正正/负负相减的时候，需要先判断这两个数的绝对值，用绝对值进行加减处理，然后取绝对值大的数的符号位，这样的效率比较低，所以就设计了反码：

正数的反码：正数的反码和原码相同

负数的反码：负数的反码是除去最高位的符号为（1），其他位取反（0变1，1变0）

一个int类型的4和-4的反码分别表示如下：

00000000 00000000 00000000 00000100

11111111 11111111 11111111 11111011

反码是相互的，一个原码A的反码B反过来B的反码就是A。但是还会存在一个+0和-0。

反码求原码的过程倒推一下即可。

补码

基于上述情况，为了解决+0和-0的情况，推出了补码的概念：

正数的补码：正数的补码与原码相同

负数的补码：负数的补码是该负数除最高位符号位（1）外其他位取反，最后一位加1，即反码+1

一个int类型的4和-4的补码分别表示如下：

00000000 00000000 00000000 00000100

11111111 11111111 11111111 11111100

补码求原码的和原码求补码一样，除最高位符号位外，其他各位取反，然后加1。补码规定0没有正负之分

根据以上概念

所以int类型的-1在计算机中表示如下：

1、得到二进制原码

10000000 00000000 00000000 00000001

2、取反码

11111111 11111111 11111111 11111110

3、取补码

11111111 11111111 11111111 11111111

我们来解答上面提到的第一个问题：

为什么byte和int值的范围最小和最大值的绝对值不一样？

我们以byte类型来说吧：

byte类型是8位，2的8次方是128，那么128和-128能否用补码表示呢：

128 二进制：原码：11111111，正数补码和原码一样，但是最高位规定是符号为，所以正数补码最大：011111111，即127.

-128 二进制：原码：绝对值：100000000，求反：011111111，加1:100000000，是不是可以用补码表示呀！

所以二进制的补码范围：

100000000 ～ 00000000 ～ 011111111 即 -128～0～127

所以在计算的时候，byte类型的-128-1，最后结果是127。同理，int值的范围是-2147483648 ～2147483647

运算符

了解了二进制的一些知识，我们再来看运算符

或与运算符

|| 或运算符（短路或）
&& 与运算符（短路与）
| 或运算符（按位或）
& 与运算符（按位与）
^ 异或运算符

||和&& 我们常用，前后都是boolean类型表达式比如

(1>3)||(4>3) = true (1>3)&&(4>3) = false

|和& 前后可以是bollean类型，也可以是int、byte类型比如：

3|1=3   (1>3)|(4>3) = true

3&1=1   (1>3)&(4>3) = false

|和&如果前后是数字类型值，计算方式是将两边的值转化为对应的二进制，然后按位或和与

3|1 等价于：

00000011

00000001

以上按位或（有1必得1，都为0则是0），结果为：

00000011 = 3 所以3&1=1

如果是两边是boolean类型，那么和||以及&&计算逻辑一样，但是：

int i=0;
if(3>2 | (++i)>0) {
    i=i+1;
}
System.out.println(i);
//结果为2

int i=0;
if(3>2 || (++i)>0) {
    i=i+1;
}
System.out.println(i);
//结果为1

这就是上面说的短路的概念，即||和&& 如果前面的结果（3>2）可以做出判断了，就不会执行后面的(++i)结果了，但是|和&，不管前面结果如何，都会执行后面的判断，然后综合两者结果给出一个判断。

^异或运算符

System.out.println(1^0);
System.out.println(1^1);
System.out.println(0^0);
System.out.println(0^1);

//结果
1
0
0
1

同位相同为0，不同为1

顺便说下上面++i和i++ 的区别是 i++是先用再赋值，++i先赋值再判断，比如：

int i=0;
System.out.println((i++)>0);
System.out.println(i);
i=0;
System.out.println((++i)>0);
System.out.println(i);

//结果
false
1
true
1

数字运算的特殊写法

现在我们知道，程序中常用的计算符号：+、-、*、/、%、|、&、^（加、减、乘、除、取余、或、与、异或）

除了简单的 i=1+1这种，还会有：

int i=0;//赋值
i+=1;//i=i+1
i-=1;//i=i-1
i*=1;//i=i*1
i/=1;//i=i/1
i|=1;//i=i|1
i&=1;//i=i&1
i%=1;//i=i%1
i^=1;//i=i^1

其他运算符

首先别忘了计算机中存在的是补码哦

byte的-6在计算机中二进制是：11111010不是10001010

<< 左移运算符

a<<b 把a的二进制位向左移动b位，右边补0，最高位符号位不变

6<<2 00000110 向左移动2位，后位补0：00011000 结果是：24 =6*2的2次方（一般来说是a乘以2的b次方）

-6<<2 结果是-24（11111010左移两位，高位不变：11101000 原码为：10011000）

但是 a乘以2的b次方不是通用的，如：

Integer.MIN_VALUE<<2 结果是0（和Integer.MAX_VALUE+1或者Integer.MIN_VALUE-1一样）

>> 右移运算符

a>>b 把a的二进制位向右移动b位，左边补0，最高位符号位不变

6>>2 00000110 向右移动2位，前位补0：00000001 结果是：1 =6/2的2次方取正数位（一般来说是a除以2的b次方）

-6>>2 结果是-1

~（取反运算符）

~a a的二进制，取反，0变1，1变0

~6 00000110 取反：11111001(这是补码)，原码：10000110+1=10000111 结果是：-7

~-6的结果是：5

~Integer.MAX_VALUE=Integer.MIN_VALUE
~Integer.MIN_VALUE=Integer.MAX_VALUE

>>>（无符号右移运算符）

a>>>b 把a的二进制位向右移动b位，左边补0，最高位符号位补0（这点和>>不一样哦）

6>>>2 结果是2

-6>>>2 结果是1073741822 (int类型的)

-6补码： 11111111111111111111111111111010

无符号右移2位：00111111111111111111111111111110

转化源码： 00111111111111111111111111111110 (正数的补码和原码一样哦)

int值为：1073741822

以上，比较绕，建议反复揣摩并写手写实验。

Java二进制与运算符知识