第四章 基本数据管理
subset()函数与随机抽样函数sample()
subset()函数:选择变量和观测
选择所有25岁以上的男性,并保留了变量gender到q4(gender,q4和其间所有列)
sample()函数:从数据集中(有放回或者无放回地)抽取大小为n的一个随机样本。第一个参数--由要抽取的元素组成的向量;第二个参数--要抽取的元素的数量;第三个参数--无放回抽样表示FALSE
从抽样的数据集中随机抽取大小为3的样本
第五章 高级函数管理
数学函数及统计函数的熟悉与使用
数学函数
数学函数
统计函数
数据的中心化与标准化scale()函数
数据中心化:数据集中各项数据减去数据集的均值
scale()函数:对矩阵或数据框的指定列进行均值为0,标准差为1的标准化
数据标准化:中心化后的数据再除以数据集的标准差
中心化和标准化
概率函数的熟悉与使用【dpqr】
概率函数
正态分布密度函数
设定随机数种子
set.seed():生成伪随机数并可以让结果重现
生成服从正态分布的伪随机数
生成多元正态数据
mvrnorm(n,mean,sigma):获取来自给定均值向量和协方差阵的多元正态分布数据
生成服从多元正态分布的数据
字符处理函数及其他实用函数的熟悉与使用
字符处理函数
字符处理函数
其他实用函数
函数的使用
将函数应用于矩阵和数据框
将函数应用于数据对象
apply()函数:将任意一个函数应用到矩阵,数组,数据框的任何维度上
apply函数