<论文笔记>Caradoc: a pragmatic approach to PDF parsing and validation

Caradoc:PDF解析与验证的实用方法

引用:

Endignoux G, Levillain O, Migeon J Y. Caradoc: A Pragmatic Approach to PDF Parsing and Validation[C]// IEEE Security and Privacy Workshops. IEEE Computer Society, 2016:126-139.

研究内容:

研究PDF文档的结构、语法及由其引起的漏洞和阅读器冲突

背景:

  • 介绍了已知的问题和检测方法
    1.Polymorphic files(多态文件):不同的PDF阅读器接受有缺陷的或者格式混淆的文件并显示出不同的内容
    2.Analysis of JavaScript content(JS内容分析):PJScan、MDScan、FCScan
    3.Statistical methods(静态分析方法):machine learning、reverse mimicry
  • 结构性问题
    1.交叉引用表、树和图等的无限循环
    2.解析和验证库的差异问题
    3.对象序号的捕捉问题等

方法:

针对由于PDF文档结构所引起的问题,将重点放在对文档格式的限制:
1.(为消除多态文件)语法(grammmar)限制和规范化:定义LR1或者LALR1语法,设置去掉注释、限制空格的语法规则,扩展规则和规范化
2.类型检验:用图的广度优先遍历算法来验证对象类型的一致性
3.高级属性的验证

实现流程:



创新点:

1.创建基础结构缺陷的PDF文档进行多阅读器环境测试
2.通过语法和结构定义解决不同阅读器的解析差异问题

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,280评论 19 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,697评论 25 709
  • 路上的人啊 笑吧,点一支兰州燃烧 管什么大排档和碳烧小金鱼 随策划案浪荡去吧 挣扎是芨芨草踏过心尖 傍晚了,没有人...
    洛城未晞阅读 290评论 0 0
  • 突然间又开始下雨了,这个季节,雨水很多。 然而,此刻的雨并没有想象中的那么讨厌。因为她不像初夏,那种貌似...
    俩俩阅读 213评论 0 1
  • 时间:2016 - 4 -4 书籍:《选款的本质》 经验交流 文摘: 选款和选股票一个道理,不在于你选什么款,关键...
    浸泡一种心情阅读 266评论 0 0