2022-03-07:substr函数在TCGA数据中提取样本信息

1:了解substr函数(截取函数),从start位置开始提取字符串,示例如下

2:用substr函数在TCGA数据中提取样本信息

tumor <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) < 10]

normal <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) >= 10]

根据TCGA数据中14,15位代表样本性质来提取分组信息。通过substr函数,截取表达矩阵中(expr),列名的第14.15的数值(用as.integer 转变为整数),然后判断14,15位置上的数值,<10(01-09)则为tumor组,>10(11)是指normal组。


因此,通过上述代码,利用substr函数即可得到样本的分组信息。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容