数据类型
- Java是一种强类型语言,所以需要为每个变量声明一种类型
- Java中有8种基本类型,包括4种整型、两种浮点型、1种用于表示Unicode编码的字符单元的字符类型char和一种用于表示真值的boolean类型
- Java有一个能够表示任意精度的算书包,通常称为“大数值 (big number)”,它不是一种新的Java类型,而是一个Java对象
整型
- byte类型占1字节,short类型占2字节,int类型占4字节,long类型占8字节
- 取值范围为
-2(字节数*8-1)~2(字节数*8-1)-1
- int类型最常用,但是如果需要表示的数值太大,就要使用long类型了
- byte和short主要用于特定的应用场合。例如,底层的文件处理或者需要控制占用存储空间量的大数组
- 由于Java程序必须保证在所有机器上都能够得到相同的运行结果,所以各种数据类型的取值范围必须固定
- 长整型数值有一个后缀
L
或者l
,推荐使用L
,不易与数字混淆 - 十六进制数值前缀为
0x
或0X
,八进制前缀为0
,010对应八进制的8,这很容易混淆,所以建议不使用八进制常数 - 二进制数前缀为
0b
或0B
- 数字字面量加下划线
_
可使数字更易读,没有其他的用处,Java编译器会去除这些下划线 - Java没有任何无符号 (unsigned) 形式的int、long、short或byte类型
浮点类型
Java中有
float
和double
两种浮点类型float
占4字节,取值范围为±3.4*10^38F
(有效位数为6-7位)double
占8字节,取值范围为±1.8*10^308F
(有效位数为15位)double
表示这种类型的数值精度是float
类型的两倍 (所以有人称之为双精度数值)绝大部分应用程序都采用
double
,在大部分情况下,float
类型的精度很难满足需求,只有很少情况用到float
,例如,需要单精度数据的库, 或者需要存储大量数据float
类型的数值有一个后缀F
或f
,推荐使用F
,避免与数字混淆,没加F
的浮点数值默认为double
类型double
类型数值后也可以加D
或者d
,可以有但是没必要十六进制中
p
表示指数而不是e
,且p
的基数是2,而不是10-
所有的浮点数值计算都遵循IEEE 754规范。具体来说,下面是用于表示溢出和出错情况
的三个特殊的浮点数值:
- 正无穷大
- 负无穷大
- NaN(不是一个数字)
例如,一个正整数除以0的结果为正无穷大,计算0/0或者负数的平方根结果为NaN
常量
Double.POSITIVE_INFINITY
、Double.NEGATIVE_INFINITY
和Double.NaN
(以及相应的Float类型的常量) 分别表示这三个特殊的值,但很少用到。if (x == Double.NaN) // is never true
是错误的,所有“非数值”的值都认为是不相同的,可以使用Double.isNaN
方法,例如if (Double.isNaN(x)) // check where x is "not a number"
浮点数有舍入误差的原因是浮点数采用二进制系统表示,二进制系统中无法精确地表示1/10,如果在数值计算中不允许任何误差,就应该使用
BigDecimal
char(字符)类型
-
char
类型原本用于表示单个字符,但是如今有些Unicode字符可以用一个char值描述,但是有的Unicode字符需要两个char值来描述 -
char
类型字面量值要用单引号括起来 -
char
类型可以表示为16进制,范围从\u0000
到\Uffff
- 转义序列
\u
还可以出现在加引号的字符常量或字符串之外(而其他所有转义序列不可以),例如:public static void main(String\u005B\u005D args)
,\u005B
和\u005D
是[和]的编码,虽然符合语法规则,但不建议使用 -
\n
换行、\r
回车、\t
制表、\b
退格、\"
双引号、\'
单引号、\\
反斜杠 - Unicode转义序列会在解析代码之前得到处理,
// look inside c:\uusers
会有一个语法错误,因为\u
后面没有跟4个十六进制数 - 字符编码:美国的ASCII、西欧语言的ISO 8859-1、俄罗斯的KOI-8、中国的GBK 18030、BIG-5、GB 2312和GBK、Unicode、UTF-8、UTF-16
- Unicode字符编码有65536 (2^16) 个代码值,由于其中增加了汉语、日语、韩语的表意文字,16位的char类型已经不能满足需要了
- 码点是指与一个编码表中某个字符对应的代码值,码点采用十六进制书写,并且加上前缀U+
- Unicode代码的码点分为17个代码级别,第一个代码级别成为基本的多语言级别,码点从
U+0000
到U+FFFF
,其余的16个级别码点从U+10000
到U+10FFFF
,其中包括一些辅助字符 - UTF-16采用不同长度的编码表示多有Unicode码点
- 强烈建议不要再程序中使用char类型,除非确实需要使用UTF-16代码单元。最好将字符串作为抽象数据类型处理
boolean(布尔)类型
- boolean(布尔)类型有两个数值:false和true,用来判定逻辑条件。
- 整型和布尔类型之间不能相互转换(C++中,数值甚至指针可以替代boolean值,0相当于false,非0数值相当于true,Java中不是这样的)例如:
if (x=0)
,在C++中编译可以通过,且判断结果总是false,但是在Java中不能同弄过编译,因为在Java中x=0
不能转换为布尔值