简介
类型指一个编程语言中的数值、表达式、函数和模块等等属性内容。类型系统包括如何定义这些不同类型,如何操作这些类型,这些类型如何相互作用等方面内容。类型系统最主要的作用是通过检查每个值的类型和这些值得流动的规则来减少类型错误的发生。检查可以是静态的(at compile time), 也可以是动态的(at run time),或者是两者的结合。类型系统也有些其他的作用,比如编译器优化等。
类型系统是编程语言的一部分,经常被嵌入到解释器和编译器中。它也被一些静态检查工具所使用。
类型错误产生原因
计算机的硬件层面是无法区分内存地址、指令码、字符、整数、浮点数的,在硬件层面这些都是bit。类型化就是赋予这些bit意义,哪些是内存中的值,哪些是一些变量等等。这样能让编程者在更高层次思考,而不用关心比特和字节。但每种类型所占用的bit数,和作用都是不同的,如果互相之间赋值移动不当,就会造成类型错误。
类型检查
如果一个语言的编译器引入越多的类型检查的限制,就可以称这个语言的类型检查越强。反之越弱。举个例子,A语言的编译器可能在编译时会认为 3 / "Hello, World"是无效的,而B语言不会,等到运行到这块代码时发现无法执行才会认为此处无效。那明显A语言比B语言更强。强/弱类型语言目前业界没有统一的定义,只能说哪种语言更强或者更弱一些。
静态类型检查
静态类型检查是基于编译器来分析源码本身来确保类型安全,比如不会出现上面的整形除以字符串的情况。静态类型检查能让很多bug在开发早起被捕捉到,并且它也能优化运行。因为如果编译器在编译时已经证明程序是类型安全的,就不用在运行时进行动态的类型检查,编译过后的代码会更优化,运行更快。
但对于一个图灵完备的语言,静态检查有时可能偏于保守。比如:
if <test> then <do something> else <error code>
即使test永远为true,对于很多静态检查的语言也会认为以上代码有问题,因为静态分析很难判断else的部分是否可以拿掉。不但如此,有些编程技术也是无法通过静态方式检查出来的,比如Java中的向下转型(downcasting,父类对象向下转为具体的子类对象,一种不安全操作)。
所以很多语言会同时使用静态检查和动态检查,静态证明可以,动态确定其他部分。有些语言还会让开发者选择用静态或者动态类型安全检查,如C#就却别了静态类型和动态类型变量。而有些语言运行开发者写一些非类型安全的代码,比如C语言允许开发者把值在任意两个长度一样的类型间强制转换。
静态类型如:Java、C、Swift、Pascal等。更多
动态类型检查
动态类型检查是在程序运行时进行的。很多类型安全的语言也都包括一些动态类型检查。动态检查可能会导致一些运行时错误,有些语言会从错误中恢复,有些会导致fatal error。
编程语言中,把只有动态类型检查没有静态类型检查的语言称为“动态类型语言”。
例如:Ruby、PHP、Objective-C、Perl、Python、JavaScript、Lisp等。更多
类型安全和内存安全
这两者是另一种区别语言种类的方法。计算机科学家将不允许操作和转化违反类型系统规则的语言称为类型安全语言;将不允许访问未被分配内存的语言称为内存安全语言,比如,一个内存安全语言会检查数组越界问题。
C语言既不是类型安全也不是内存安全的语言,如下代码:
int x = 5;
char y[] = "37";
char* z = x + y;
这样让z指向了y地址加5的地址,可能包含了垃圾数据,既访问了未分配的内存,也产生不同类型间的不安全转换。
参考文献:
https://en.wikipedia.org/wiki/Type_system?oldformat=true