js编译机制
首先,对javascript我们通常称之为“动态”或“解释执行语言”,但事实上它是一门编译语言。但与传统的编译语言不同,它不是提前编译的,编译结果也不能在分布式系统中进行移植。
在传统编译语言的流程中,程序中的一段源代码在执行之前会经历三个步骤,统称为“编译”
1、分词/词法分析(Tokenizing/Lexing)
这个过程会将由字符组成的字符串分解成(对编程语言来说)有意义的代码块,这些代码块被称为词法单元(token)。例如,考虑程序var a = 2; 这段程序通常会被分解成下面这些词法单元: var、a、=、2、;. 空格是否会被当作词法单元,取决于空格在这门语言中是否具有意义。
分词(tokenizing)和词法分析(Lexing)之间的区别是非常微妙的、晦涩的,主要差异在于词法单元的识别是通过有状态还是无状态的方式进行的。简单来说,如果词法单元生成器在判断a是一个独立的词法单元还是其它词法单元的一部分时,调用的是有状态的解析规则,那么这个过程就被称为词法分析。
2、解析/语法分析(Parsing)
这个过程是将词法单元流(数组)转换成一个由元素逐级嵌套所组成的代表了程序语法结构的树。这个树被称为“抽象语法树”(Abstract SyntaxTree, AST)。var a = 2;的抽象语法树中可能会有一个叫做VariableDeclaration的顶级节点,接下来是一个叫作Identifier(它的值是a)的子节点,以及一个叫作AssignmentExpression的子节点。AssignmentExpression节点有一个叫作NumericLiteral(它的值是2)的子节点。
3、代码生成
将AST转换成可执行代码的过程被称为代码生成。这个过程与语言、目标平台等息息相关。
抛开具体细节,简单来说就是有某种方法可以将var a = 2;的AST转换为一组机器指令,用来创建一个叫作a的变量(包括分配内存等),并将一个值储存在a中。
任何javascript代码片段在执行前都要执行编译(通常就在执行前),大部分情况下编译发生在代码执行前的几微秒(甚至更短)的时间内。比如编译器对var a= 2;这段代码进行编译,然后做好执行它的准备,并且通常马上就会执行它。
最后,对于JS执行时关于分号的问题: J中会自动清除句子和句子之间的空格及tab缩进,这样就可以允许用户编写的代码更加随性和更加可读,在该行代码解析的时候如果该行代码可以解析,就会在该行代码最后自动填写分号,如果该行代码无法解析就会把该行代码和下一句代码合并,直到代码可以解析。
JS中如果一个语句以( [ / + - 开头, 就有可能于上一句合在一起解析。