调试R的工具包

R作为开源数据分析软件,世界各地的开发者贡献了海量的工具包(Package)。为了验证分析结果或理解其计算过程,常常需要对工具包进行调试(Debug),在源代码中设置断点、对程序语句进行追踪。我最近对R的一个工具包源代码进行了调试,下面简单介绍其配置过程。由于仅靠回忆,有些地方可能不太准确。

  • 安装RStudio。RStudio用来调试R代码非常方便,它有开源版本,可以免费下载。
  • 下载待调试R工具包的源代码(Source Code),R工具包在CRAN网站上都提供了源代码版(Source)以及二进制版(Binary)。下载后解压该.tar.gz文件到文件夹。
  • 在RStudio里新建Project,选择上一步的解压文件夹作为Project文件夹。选择菜单 Tools: Project Options,在Build Tools选项页下有提示,需要配置C编译工具,RStudio会自动安装RTools(我记不清是在哪一步后会自动安装)。
  • 需要安装MikTex,否则Build工具包时会提示“pdflatex not available”。安装MikTex后需要将其路径添加到系统的环境变量里。另外还需要安装三个MikTex包:natbib, fancyvrb以及supp-pdf.mkii,其中第一个包网上只有源文件,需要在DOS下用tex命令把.ins文件生成.sty文件。MikTex安装文件包后,需要在Settings对话框General选项卡里点击Refresh FNDB。
  • 在RStudio右上方面板里选Clean and Rebuild,它就会把Project文件夹里的工具包进行编译链接。
  • 在RStudio里新建.R文件,在程序里调用该工具包里的函数(不要使用library加载该工具包,但需要安装该工具包的binary版本,这样能保证其依靠的工具包都已安装)。在工具包里某个函数里设置断点,在RStudio左上方面板点击Source按钮。新建的.R文件就会被运行,并进入到工具包里设置的断点处。RStudio右上方面板会显示调试时各变量的值(一般建议选Grid模式而非List)。对于复杂的变量,可使用str命令来显示变量的组成。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容