第一步--类似教程学习
用到的包有:affyPLM,
affy,
RColorBrewer,
immpute,
limma,
pheatmap,
ggplot2
ReadAffy函数:
读取当前工作目录下所有cel格式文件,并生成表达矩阵
rma算法:
一种Affmetrix芯片数据预处理算法参考链接
exprs函数:提取表达矩阵信息
wirte.table函数:
注意各部分的意义参考链接
read.table函数:注意各部分的意义参考链接
match函数:
左边的值在右边的位置
user_id为1,2,3,4,每一个数字在w中的位置依次是4,1,2,
is.na函数:
检测是否为Not Available,即是不是缺失值
!(感叹号):
表示“与、或、非”中的“非”的意思
which函数:
找到满足条件的下标
as.matrix函数:
一般是将整个数据框(各列数据类型必须相同,否则进行强制转换)转换为维数相同的矩阵,目的是为了利用那些矩阵运算的函数
方括号"[]":
表示从元素中索引
factor(因子):
名义型变量和有序类别变量在R中称为因子,函数以一个整数向量的方式储存类别值。
https://www.cnblogs.com/larryzzZ/p/6650715.html
apply函数:
把一个function作用到array或者matrix的margins(可以理解为数组的每一行或者每一列)中,返回值时vector、array、list。
简单的说,apply函数经常用来计算矩阵中行或列的均值或其他函数值。
https://www.cnblogs.com/nanhao/p/6674063.html
rnorm函数:
(n, mean = 0, sd = 1)
tapply函数:
通常有三个参数,第一个指定输入数据,第二个是指定输入数据如何分组,第三个参数指定在每一个分组内用什么函数,整体功能概括为把数据按照某种依据分组,在每个组内进行某个运算。
https://www.zhihu.com/question/39843392
自定义函数function:
https://blog.csdn.net/xxzhangx/article/details/52924851
limma函数:
aggregate函数:
一种整合函数,可用于多个探针对应同一个基因的情况时对数据进行分类整合
一个综合使用的例子(sjz自上传数据集-空气质量年月日)
另一个综合使用的例子(mtcars数据集)
colMeans函数:
计算矩阵中列的平均值
综合示例
dplyr包之排列: arrange()
split函数
split(x, f, drop = FALSE, sep = ".", lex.order = FALSE, ...)
-x: 一个待分组的向量或者data frame
-f: 函数,一个factor或者list(如果list中元素交互作用于分组中),以此为规则将x分组
-drop: 逻辑值,如果f中的某一个level没有用上则被弃用
-value: 一个储存向量的list,其形式类似于分组完成之后返回的那个list
函数split()可以按照分组因子,把向量,矩阵和数据框进行适当的分组。它的返回值是一个列表,代表分组变量每个水平的观测。这个列表可以使用sapply(),lappy()进行处理(apply – combine步骤),得到问题的最终结果。
只是分组,既可以对向量分组,也可以对数据框分组。
impute包:
使用KNN算法处理缺失值
蝴蝶迁移性配对研究范例
详情可查阅参考手册
limma包:
1.帮助文档查询
>library(limma)
>limmaUsersGuide()
# or alternatively
>help.start()
#and follow the links to the limma package help.
#输出:如果什么都不发生的话,你应该自己打开‘http://127.0.0.1:25351/doc/html/index.html’
错误代码示例
#错误
write.table(probe_exprs,file="cancer.probeid.exprs.txt",sep="\t")
#正确
write.table(probe_exprs,file="cancer.probeid.exprs.txt",sep="\t",quote=F,row.names = F)
输出时自动调整第一列为列号,而使得原始的第一列的数据变成第二列