【课程笔记】南大软件分析课程2——IR

1.编译器和静态分析的关系

源码->（Scanner - 词法Lexical分析-Regular Expression）->（Parser- 语法Syntax分析-Context-Free Grammar），生成AST ->（Type Checker - 语义Semantic分析 - Attribute Grammar），生成 Decorated AST -> Translator，生成IR，进行静态分析 -> Code Generator

1-1-编译器原理.png

2.AST vs IR

AST ：高级，更接近于语法结构，依赖于语言种类，适用于快速类型检查，缺少控制流信息

IR：低级，更接近于机器码，不依赖语言种类，压缩且简洁，包含控制流信息。是静态分析的基础

1-2-AST&IR.png

3.IR:3-地址代码（3AC）

// 最多1个操作符
a+b+3  ->  t1 = a+b
                 t2 = t1+3
Address：
    Name:a、b
    Constant: 3
    编译器的临时变量：t1、t2

1-3-常用3地址码.png

4.实际静态分析器的3AC—Soot（Java）

Soot-常用的Java静态分析框架

// java IR（Jimple）基本知识
invokespecial：call constructor, call superclass methods, call private methods
invokevirtual: instance methods call (virtual dispatch)
invokeinterface: cannot optimization, checking interface implementation
invokestation:call static methods

Java 7: invokedynamic -> Java static typing, dynamic language runs on JVM

method signature: class name, return type, method name(parameter1 type, parameter2 type)