第四章 基本数据管理
subset()函数与随机抽样函数sample()
subset()函数:选择变量和观测
sample()函数:从数据集中(有放回或者无放回地)抽取大小为n的一个随机样本。第一个参数--由要抽取的元素组成的向量;第二个参数--要抽取的元素的数量;第三个参数--无放回抽样表示FALSE
第五章 高级函数管理
数学函数及统计函数的熟悉与使用
数据的中心化与标准化scale()函数
数据中心化:数据集中各项数据减去数据集的均值
scale()函数:对矩阵或数据框的指定列进行均值为0,标准差为1的标准化
数据标准化:中心化后的数据再除以数据集的标准差
概率函数的熟悉与使用【dpqr】
设定随机数种子
set.seed():生成伪随机数并可以让结果重现
生成多元正态数据
mvrnorm(n,mean,sigma):获取来自给定均值向量和协方差阵的多元正态分布数据
字符处理函数及其他实用函数的熟悉与使用
将函数应用于矩阵和数据框
apply()函数:将任意一个函数应用到矩阵,数组,数据框的任何维度上