Data-导入数据1

准备导入R的数据文件的最佳实践

在前一章中,我们提供了R编程的要点,包括安装、启动、基本数据类型和算术函数。在下一篇文章中,您将学习如何将数据导入到R中。为了避免在将文件导入到R中时出错,您应该确保您的数据准备充分。

在本文中,我们将描述一些在导入R之前准备数据的最佳实践。

打开你的文件

我们假设您使用Excel打开并准备文件。

准备文件

行和列名称:

将第一行用作列标题(或列名)。通常,列表示变量。

使用第一列作为行名。通常行表示观察结果。

每一行的名称应该是唯一的,所以删除重复的名称。

列名应该与R命名约定兼容。


命名约定:

避免使用空格的名称。好的列名: Long_jump or Long.jump。错误的列名:Long jump

避免用特殊符号命名:?,$,*,+,#,(,),-,/,},{,|,>,<等。只能使用下划线。

避免变量名以数字开头。用字母代替。好的列名:sport_100m或x100米。坏的列名:100m

列名必须唯一。不允许使用重复的名称。

R区分大小写。这意味着Name与name或NAME不同。

避免数据中出现空白行

删除文件中的任何注释

用NA替换缺失值

如果有包含日期的列,请使用四位数格式。格式正确:01/01/2016。错误格式:01/01/16

最终文件:

我们的最终文件应该是这样的:

保存文件

我们建议将文件保存为.txt(制表符分隔的文本文件)或.csv(逗号分隔的值文件)格式。

如果仍要将其保存为xls | xlsx文件格式,则可以执行此操作。我们将在下一篇文章中学习如何将xls | xlsx文件导入R。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,438评论 0 5
  • WinRAR - 最新版本的更新 版本 5.50 1. WinRAR 和命令行 RAR 默认使用 RAR ...
    王舒璇阅读 2,412评论 0 2
  • 数据的导入 参考文章 在R语言中,常常用到导入数据的源文件是Excel文件,CSV文件,文本文件等等。 导入csv...
    天涯清水阅读 33,356评论 0 13
  • 牛二本来没有死,后来却死了。 1. 那会他不但没死,反而还还觉得自己过得挺好,老婆孩子热炕头,车子房子也都有,虽说...
    叶人儿阅读 1,705评论 8 8
  • 1 昨天听秋叶大叔的分享,脑海突然跳出《圣经·旧约·创世记》里面通天塔的故事。曾经人类联合起来兴建希望能通往天堂的...
    虚室阅读 355评论 3 3