2021-10-13 R语言第五次上机

第四章 基本数据管理

subset()函数与随机抽样函数sample()

subset()函数:选择变量和观测


选择所有25岁以上的男性,并保留了变量gender到q4(gender,q4和其间所有列)

sample()函数:从数据集中(有放回或者无放回地)抽取大小为n的一个随机样本。第一个参数--由要抽取的元素组成的向量;第二个参数--要抽取的元素的数量;第三个参数--无放回抽样表示FALSE


从抽样的数据集中随机抽取大小为3的样本

第五章 高级函数管理

数学函数及统计函数的熟悉与使用


数学函数


数学函数


统计函数


数据的中心化与标准化scale()函数

数据中心化:数据集中各项数据减去数据集的均值

scale()函数:对矩阵或数据框的指定列进行均值为0,标准差为1的标准化

数据标准化:中心化后的数据再除以数据集的标准差


中心化和标准化

概率函数的熟悉与使用【dpqr】


概率函数


正态分布密度函数

设定随机数种子

set.seed():生成伪随机数并可以让结果重现


生成服从正态分布的伪随机数

生成多元正态数据

mvrnorm(n,mean,sigma):获取来自给定均值向量和协方差阵的多元正态分布数据


生成服从多元正态分布的数据

字符处理函数及其他实用函数的熟悉与使用


字符处理函数


字符处理函数


其他实用函数


函数的使用

将函数应用于矩阵和数据框


将函数应用于数据对象

apply()函数:将任意一个函数应用到矩阵,数组,数据框的任何维度上


apply函数
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容