参考视频:https://www.bilibili.com/video/BV19x411X7C6?p=14(14-16)
资料获取:关注微信公众号“基因学苑”,后台回复关键字“Rdata”
一、Excel案例
Excel和R比较
最大不同点:R不能使用鼠标,只能通过代码来完成;而Excel可以用鼠标来完成复制粘贴等工作。
代码更适合批量化和自动化,R可用来处理大数据,使用鼠标往往更不方便。案例:2015年度中国城市GDP排名.xlsx
行:观测值
列:变量值
二、内置数据集
储存在datasets中,都是比较经典的数据集,收集的都是美国、欧美的一些数据
>help(package="datasets")
#列出所有数据集
>data()
例如:
#北美141条河流长度
> rivers
[1] 735 320 325 392 524 450 1459 135 465 600 330 336 280 315
[15] 870 906 202 329 290 1000 600 505 1450 840 1243 890 350 407
[29] 286 280 525 720 390 250 327 230 265 850 210 630 260 230
[43] 360 730 600 306 390 420 291 710 340 217 281 352 259 250
[57] 470 680 570 350 300 560 900 625 332 2348 1171 3710 2315 2533
[71] 780 280 410 460 260 255 431 350 760 618 338 981 1306 500
[85] 696 605 250 411 1054 735 233 435 490 310 460 383 375 1270
[99] 545 445 1885 380 300 380 377 425 276 210 800 420 350 360
[113] 538 1100 1205 314 237 610 360 540 1038 424 310 300 444 301
[127] 268 620 215 652 900 525 246 360 529 500 720 270 430 671
[141] 1770
#输出向量的矩阵信息
>name(euro)
[1] "ATS" "BEF" "DEM" "ESP" "FIM" "FRF" "IEP" "ITL" "LUF" "NLG" "PTE"
>data(package="xxx")
三、数据结构
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。
- R中的数据类型
- 数值型,可直接用于计算,加减乘除
- 字符串型,进行连接、转换、提取等
- 逻辑型,真或假
- 日期型
- 一般编程数据结构
普通数据结构:向量、标量、列表、数组、多维数组
特殊数据结构:
Perl中的哈希、Python中的字典、C语言中的指针等 - R对象
object:可以赋值给变量的任何事物,包括常量、数据结构、函数甚至图形等。对象具有某种模式,描述了对象是如何存储的,以及某个类。
R中存储数据对象的类型:
①向量、标量
②矩阵
③数组
④列表
⑤数据框
⑥因子
⑦时间序列