生信技能树2021数据挖掘线上课笔记,需要结合课程讲解服用 TCGA下载数据的方法-gdc-client(软件名):需要写命令运行,官方下载的数据,下载的数据是零散的,每个病...
0.背景 关于样本id和分组信息:TCGA的样本id里藏着分组信息[https://mp.weixin.qq.com/s/UohDh5fHkTPlwNp43ivWHg] TC...
稳健PCA,就是一种通过构造稳健的均值向量和稳健的协方差矩阵的主成分分析方法,其目标是从输入矩阵中去除稀疏缺失并获得低秩近似,可以有效消除数据集中异常值的影响和提高寻找大型数...
随着对人类疾病和生物过程的研究,从实验测序产生了大量的功能性lncRNA集合。虽然目前已开发多个lncRNA数据库/分析工具,但现有工具仍存在lncRNA信息不全面的问题,例...
欢迎大家关注我的公众号:一只勤奋的科研喵[http://mp.weixin.qq.com/mp/homepage?__biz=Mzg2MjU2NDQwMg==&hid=2&s...
最近很多朋友都在参加公务员,事业单位考试。考完试,大家的感觉都是题不难,可是就是不会,这是多么尴尬的问题。 现在大家长大了,回过神来,才发现,读书的时候,荒废了多少的好时光,...
一、ENTREZID转换 进行功能注释,首先需要对差异基因deg数据集进行ENTREZID转换 二、输入数据准备 接下来拿出up基因和down基因的ENTREZID,组成di...
A MicroRNA Signature Identifies Pancreatic Ductal Adenocarcinoma Patients at Risk for L...
首先,vst也是基于负二项分布的一种标准化方法我们为什么在大样本数据中需要采用vst的标准化方法呢?这是因为: 1.It is a one-size-fits-all sol...
好久没有学习RNAseq的东西了,今天随意翻到一篇很不错的总结,这里了只是我的学习笔记,原文会更好一些:https://mp.weixin.qq.com/s/u_ZC7wsC...
在肿瘤研究中往往需要分析一些事件(如死亡、复发)的时间是否与一些因素相关,像这样数据输出为事件和时间的分析称为生存分析。因为删失数据的存在,让生存分析不能用许多常规的数据分布...