"R实战"专题·第2篇
编辑 | 科白君
本期推送内容
尽管学习R语言不像C语言那种有难度,但还是给新手带来无尽的困难。特别是,当你在run一份code,发现每行code都会出现error,更是无奈。然而,在学习R语言的过程中,这些报错对于小白来说又是无法避免的。刚开始学习R语言的时候,我也遇到了各种各样的报错,确实让我很崩溃。那么如何在程序报错后快速找到原因呢?我发现常见的报错都是规律可循的,这里我给大家总结了一些初学者容易踩的坑,以及如何copy with它们,以Rstudio为例。
想学习R语言的朋友可以持续关注微信公众号:科白君的土壤世界
1)Cannot find XX.csx/txt/xlsx等等,这是新手常见的报错--工作路径问题。在出现这类报错时,第一反应看看自己在导入/读取文件前是否设置了所要读取文件的工作路径。在本例子中,我有两种情况需要注意。一是,在读取文件前没有设置工作路径,解决办法:补充该工作路径所在路径,用setwd()设置;二是,设置了工作路径,但是当前工作路径不是该文件所在的工作路径,解决办法:更改工作路径,先用getwd()检查当前的工作路径,再用setwd()进行修改。
个人建议:我不太推荐每次在读取前用setwd()来设置工作路径,因为这样得保证每次所用数据都必须在同一个工作路径才可以,否则都需要改。然而,通常我们的数据都是根据个人情况分别放在不同的文件夹,即工作路径都不同。因此,每次读取文件前,我在这里推荐大家用这个方法选择工作路径(choose directory)以解决我提到的问题:
2)Could not find function "XXX"等等,这个报错是属于程序包没有加载的问题。因此,我们在使用某个函数时,首先要清楚知道该函数属于哪个程序包里的,并先用library()读取该程序包,然后再运行该函数即可。
如果不清楚该函数是哪个程序包,我们可以用?"read.xlsx"或 help("xx")来咨询,咨询结果如下:红色框即为所需要的程序包,需要注意的是在咨询的时候必须要加上引号" "。
3)unexpected input in 'XXX', 这类错误是初学者常遇到的--中英文标点符号问题。新手在出现这类报错时,第一反应看报错的位置in 后面停在哪里。在下面例子中,句子停在了Species,"之后,通过仔细查看代码,能够发现句子中报错的位置是一个中文格式的逗号。因此,把中文格式的逗号改成英文格式即可,这种报错只要在R语言练习一段时间后就基本不会再烦了。
个人建议:由于rstudio刚开始使用时用的是默认的背景模板,为了在学习过程中节省一些时间,提高代码的准确率,可以用下面方法更换一下背景模板,选择一种最适合自己的模板,减少不必要的错误。
4)unexpected input in "setwd(I:\",这里我们发现与第三类错误显示同样报错。但是我们要清楚在R语言中引用地址的时候,需要注意是'/'还是'\\',如果在地址引用时,用了'//'或'\'就会报错。下面我们用例子来展示,我们发现我们在设置路径时,符号用错了,直接报错。在读取数据时,工作路径的符号也用错了,出现了同样的报错。这里,我们只需要熟记一点,在R语言中要用'/' or '\\'即可。
报错结果:
更正展示:
5)unexpected symbol in: "XXX",这类报错是比较常见且简单的,与第三种错误类似,属于缺少or多余符号。这类错误出现时,应该第一时间查看error中出现报错的位置,出现问题的地方在两个报错的两个双引号" "之间,因此应该出现在第一行和第二行代码之间。下面的例子中,我们发现缺少了括号,因此我们在代码的最后把括号补充上后,问题就解决了。
个人建议:如果在输入有括号的代码时,可以把鼠标在每个右半边的括号点一下,rstudio会自带提醒这一组括号是否完成输入:当前括号表示是第二个左半边括号,因此需要在最右边再补充一个括号。
6)unexpected symbol in "1r",尽管这类报错和第五类显示同种错误,但是不是完全一样。这类错误也是新手会犯的,但这类错误很简单,我们在定义目标变量的时候,不能用数字作为定义名。这里我提供一个思路去理解,如果可以用数字打头,也需要加上字母:例如1+UUU; 1+AALL。然而这些不能作为变量名,因为编译器不能区分究竟是数字还是变量名。利用数字和字母一起显然没有只用字母来的简便,索性就去掉了。因此,我们需要记住的是,在定义目标变量名称的时候不能用数字打头。
7)object 'xxx' not found,这类报错比较直观,就是如错误所描述的:找不到目标的问题。在下面例子中,就是报错信息中的a找不到。通常可能是你自己在运行代码时候,run 的太快了,上一行的数据读取信息还没读,就紧接着跑下一行代码,所以会出现第二行代码报错,没有找到a这个变量。以后出现这类错误时,只需要查看一下自己环境变量是否缺少该目标变量,如果缺少了补充上就可以了。
个人建议:在报错时,先检查下环境变量中的变量,是否能找到所需要的目标。如果没有的话,把目标变量读取后再运行报错的代码即可。
TBC...