前言
接下来讲讲预定义数据类型。关于数据类型,其实是非常值得透彻研究的。
01
预定义数据类型
值类型和引用类型
C#将把数据类型分为两种,值类型和引用类型,值类型存储在堆栈上,引用类型存储在托管堆上。因此,对于值类型,如果:
Int a = 1;
Int b = a;
那么内存中就有两份的值1。
而对应引用类型,如果:
User userA = new User();
User userB = userA;
那么内存中只有一份User对象,userA和userB都指向它。
需要提到一句的是,结构(struct)是值类型,虽然我从来没有用到,但在需要极致优化性能的时候,可能是用的上的。
这基本上是大家都知道的。但在实际使用中,这种所谓的引用关系会比较隐秘,造成我们使用引用类型上的一些问题,所以我们需要更深入的讲一讲。
CTS类型(Common Type System)
CTS类型是.Net Framework的类型,而不是C#的类型,即我们之前讲到,CLR也是高度对象化的。在CLR层面规定了通用的类型,这样不同的开发语言比如C#,VB.Net才能良好的融合。比如Int32,Int64就是.Net框架的结构。我们定义一个Int和long既可以写为:
int val = 10;
long val2 1000;
也可以写为:
Int32 val = 10;
Int64 val2 = 1000;
当然我们实际使用中不会像后者那么用。
我们还可以发现,Int32,Int64是结构(struct),是值类型,所以这种类型通用化对.Net框架的性能的影响极小。
预定义的值类型
预定义的值类型有:
整数:
浮点数:
基本类型在赋值时,可以使用后缀(可大写或者小写)明确指定类型,比如:
Long val1 = 10L;
float val2 = 12.3F;
对于整数类型,如果不明确指定类型,系统会默认为int,而对于浮点数类型,不明确指定时系统默认为double。
我曾经很疑惑的是,既然这么说,是不是在初始化的时候一定要这么指定后缀呢?毕竟初始化基本类型是比较常见的操作。而我现在认为,非特殊情况下,基本上是不需要的。事实也是如此,我们很少见到有这么写的。比如对于:
Long val1 = 10L; 和 Long val1 = 10;
效果是一样的。因为val1定义为long,作为int的10会自动向上转型为long,不会有精度损失。而对于:
float val2 = 12.3F; 和float val2 = 12.3; 有没有区别呢?是有的,因为后面这句赋值语句有错误,不能通过编译,因为作为double的12.3转化为float,是有精度损失的,所以要么你强制转换,要么你加F。
所以我们会发现,你写一个对基础类型的赋值语句,你能写出来,且编译器没提示错误,就是没问题的;不能写的,编译器会提醒你。编译器已经足够智能,不需要担心要不要加后缀的问题。
Decimal类型:
Decimal是个很重要的类型,我在实际项目中,从来没有用过float和double,因为它们有精度问题,我都是要么整数(用于数量),要么Decimal(用于价格,金额等)。.Net把它称为“用于财务计算的专用类型”。我们对比Java会发现,Java的高精度计算类型是一个叫做BigDecimal的普通类,它的初始化要用比如new BigDecimal(10)这种类创建的方式来实现。而在C#中将其地位提升为预定义类型。但同时,书中也强调,Decimal仍然不是“基本类型”,我们可以认为,它的本质和Java的BigDecimal是一样的,只是将其“模拟”为基本类型,这样使用更便捷,但它的计算实际上仍然会有性能损失。
Bool类型:
字符类型:
字符类型,有多种表示方式:
char val1 = 'A'; //字面量
char val2 = '\u0041'; //Unicode
char val3 = (char)65; //int转换
char val4 = '\x0041'; //16进制
字符常用的还有用“转义符”(反斜杠\)表示的特殊字符,比如换行符\n,回车符\r等。
预定义的引用类型
预定义引用类型的概念太重要了,因为它是.Net整个类结构的基础。
上图的每个字都值得分析。我们注意到,object类型被叫做“根类型”,它是包括值类型的所有其他类型的父类型。为什么值类型也是?因为值对象可以被“装箱”并放入托管堆而成为引用对象,而装箱又导致拆箱,这是非常重要的概念,对这个概念理解的不好,会写出意想不到的复杂代码。
而String类型的概念是:Unicode字符串,也很重要,这说明什么,说明字符乱码问题得到了彻底解决,一个英文和一个中文字符长度相同,等等。String类型是个非常特殊又奇怪的类型,它是引用类型,但它的行为又像值类型,这是特意设计的,因为字符串的使用太普遍了,而值类型的概念比引用类型使用起来更直观和简单。它的几个特点:
String对象是引用类型,它被分配在堆上,而不是栈上
因此,当把一个字符串变量赋予另一个字符串时,会得到对内存中同一个字符串的两个引用
字符串是不可改变的。修改其中一个字符串,就会创建一个全新的String对象,而另一个字符串不发生任何变化
有了以上特性,我们可以看到值类型的行为了:当赋予一个不同的字符串值,系统总给你new一个字符串新值;而当你赋值已有的某个字符串时,系统从堆中给你找出来赋值给你。这样既保证了值类型的行为,也优化了引用类型的性能,是一种平衡的好方案。当然在某些场景下,String的这种特性也会导致性能问题,比如在for循环中拼接一个字符串,这个时候简单的用赋值语句改变String时,就会导致一直创建新的字符串,性能大降,所以这个时候我们常常会用StringBuilder来构造字符串。
字符串中,常碰到转义符的问题,字符串中的\将被理解为转义符,怎么让C#不将其理解为转移符呢?“将转义符再转义”,即再加\,比如一个目录路径表示为:
string path = “C:\\windows\\Temp”;
我们可以简化这种写法为:
string path = @“C:\windows\Temp”;
@不仅是用于描述路径,还用于其他多种场景,这会让人混淆,@有没有可明确描述的效用?有的,它的功能可通用性的描述为:在这个@后的所有字符都看作是其原来的含义。比如上面的路径例子,原来的含义就是\就是路径的表述,而不是转义符的意思。还有比如@用在字符串换行中:
string path = @“华为是
中国的骄傲”;
当没有@时,字符串在输入中换行会导致编译错误,因为回车换行在语言规范中有特殊含义,加了@表示告诉编译器,“我这字符串中的换行符就是原本的换行的意思,你不用特殊解释”。
其他所有用@的场景,都可以如此解释,这是一种可通用的解释。
预定义类型内容非常长,就先讲到这里,下一篇我们讲流控制。
觉得文章有意义的话,请动动手指,分享给朋友一起来共同学习进步。
附文:
欢迎关注本人微信公众号,更及时的关注最新文章(每周三篇原创文章,以及多篇专题文章):