有时候去面试,像iOS开发岗位,面试官会顺着运行时和动态性往下问,如果你不知编程语言的一些基本知识就懵逼了!作为一个开发者,你连弱类型、强类型、动态类型、静态类型语言傻傻分不清吗?
这篇文章综合介绍了四种分类,特别地,为了方便大家快速有效的学习,笔者尝试用思维导图的办法描述编程语言的区别。一般来讲,看第一个图就够了。但如果你想更深入地了解,也可以参考下面的文字表述。
一、看图区别编程语言
作者:陈满iOS
二、语法角度的文字表述
作者:Kaiye Chang
1. 动态语言vs静态语言(动态类型语言vs静态类型语言)
Static typing when possible, dynamic typing when needed
型态系统(type system):程序中专门处理数据的系统,语言可以分为:
动态型态系统(dynamically typed systems),例如Lisp,JavaScript,Tcl和Prolog
静态型态系统(statically typed systems),例如C++和Java
静态型态系统statically typed systems)可进一步分为:
包含宣告型态(manifest type)语言,即每一个变量和函数的型态都清楚地宣告
type-inferred语言(例如MUMPS,ML)
2. 四种语言分类及其区别
动态类型语言(Dynamically Typed Language):
运行期间才做数据类型检查的语言,即动态类型语言编程时,永远不用给任何变量指定数据类型。该语言会在第一次赋值给变量时,在内部将数据类型记录下来。
例如:ECMAScript(JavaScript)、Ruby、Python、VBScript、php
Python和Ruby就是典型动态类型语言,其他各种脚本语言如VBScript也多少属于动态类型语言
优点:方便阅读,不需要写非常多的类型相关的代码;
缺点:不方便调试,命名不规范时会造成读不懂,不利于理解等
静态类型语言(Statically Typed Language):
编译期间做检查数据类型的语言,即写程序时要声明所有变量的数据类型,是固定的。使用数据之前,必须先声明数据类型(int ,float,double等)。相当于使用之前,首先要为它们分配好内存空间。
例如:C/C++是静态类型语言的典型代表,其他的静态类型语言还有C#、JAVA等
优点:结构非常规范,便于调试,方便类型安全
缺点:为此需要写更多类型相关代码,不便于阅读、不清晰明了
强类型定义语言(Explicit type conversion,强制数据类型定义语言,类型安全的语言):
一旦变量被指定某个数据类型,如果不经强制转换,即永远是此数据类型。
举例:若定义了一个整型变量a,若不进行显示转换,不能将a当作字符串类型处理
强类型语言是指需要进行变量/对象类型声明的语言,一般情况下需要编译执行。例如C/C++/Java/C#
弱类型定义语言(Implicit type conversion,类型不安全的语言):
数据类型可以被忽略的语言。它与强类型定义语言相反, 一个变量可以赋不同数据类型的值。
举例:在VBScript中,可以将字符串 '12' 和整数 3 进行连接得到字符串 '123', 然后可以把它看成整数 123,而不需要显示转换
例如PHP/ASP/Ruby/Python/Perl/ABAP/SQL/JavaScript/Unix Shell等
注意:强类型定义语言在速度上可能略逊色于弱类型定义语言,但是强类型定义语言带来的严谨性能够有效的避免许多错误。
3. 分类小结
“语言是否动态”与“语言是否类型安全”之间是完全没有联系的!
4. 举例说明
Python是动态语言,是强类型定义语言(类型安全的语言);
VBScript是动态语言,是弱类型定义语言(类型不安全的语言);
JAVA是静态语言,是强类型定义语言(类型安全的语言)
三、编译和运行角度的文字表述(与上述从语法角度来区别好像有区别)
作者:rainoftime
类型系统的一些概念,众说纷纭,使用上也比较乱。有些东西,甚至不好严格定义。以下算学术界的一种相对“严格”的说法。
1. 先定义一些基础概念
Program Errors
trapped errors。导致程序终止执行,如除0,Java中数组越界访问
untrapped errors。 出错后继续执行,但可能出现任意行为。如C里的缓冲区溢出、Jump到错误地址
Forbidden Behaviours
语言设计时,可以定义一组forbidden behaviors. 它必须包括所有untrapped errors, 但可能包含trapped errors.
Well behaved、ill behaved
well behaved: 如果程序执行不可能出现forbidden behaviors, 则为well behaved。
ill behaved: 否则为ill behaved...
2. 有了上面的概念,再讨论强、弱类型,静态、动态类型
强、弱类型
强类型strongly typed: 如果一种语言的所有程序都是well behaved——即不可能出现forbidden behaviors,则该语言为strongly typed。
弱类型weakly typed: 否则为weakly typed。比如C语言的缓冲区溢出,属于trapped errors,即属于forbidden behaviors..故C是弱类型
前面的人也说了,弱类型语言,类型检查更不严格,如偏向于容忍隐式类型转换。譬如说C语言的int可以变成double。 这样的结果是:容易产生forbidden behaviours,所以是弱类型的
动态、静态类型
静态类型 statically: 如果在编译时拒绝ill behaved程序,则是statically typed;
动态类型dynamiclly: 如果在运行时拒绝ill behaviors, 则是dynamiclly typed。
3. 误区
大家觉得C语言要写int a, int b之类的,Python不用写(可以直接写a, b),所以C是静态,Python是动态。这么理解是不够准确的。譬如Ocaml是静态类型的,但是也可以不用明确地写出来。。
Ocaml是静态隐式类型
静态类型可以分为两种:
如果类型是语言语法的一部分,在是explicitly typed显式类型;
如果类型通过编译时推导,是implicity typed隐式类型, 比如ML和Haskell
4.下面是些例子
无类型: 汇编
弱类型、静态类型 : C/C++
弱类型、动态类型检查: Perl/PHP
强类型、静态类型检查 :Java/C#
强类型、动态类型检查 :Python, Scheme
静态显式类型 :Java/C
静态隐式类型 :Ocaml, Haskell
即,如下图
5.补图
补图:
红色区域外:well behaved (type soundness)
红色区域内:ill behaved
如果所有程序都是灰的,strongly typed
否则如果存在红色的程序,weakly typed
编译时排除红色程序,statically typed
运行时排除红色程序,dynamically typed
所有程序都在黄框以外,type safe
四、结论
那么问题来了,眼尖的人可能已经发现了,关于【强弱类型】,有两种截然不同的分类观:一个是从数据类型转换和语法角度,一个是编译和运行中操作不同的角度。
前者认为C是强类型,后者认为C是弱类型,所以冲突了。那么,大神们认为哪种更准确?