上一篇关注单因素多因素cox模型的构建并在lung数据集中进行了实战survival包学习笔记——cox回归(一) - 简书 (jianshu.com)[https://ww...
单细胞绘图系列: Seurat绘图函数总结[https://www.jianshu.com/p/95e61f7e834d] 使用ggplot2优化Seurat绘图[https...
一、理解TCGA数据中的甲基化位点 甲基化是什么?启动子是什么?甲基化(或者CpG岛)是如何影响基因表达的? 人的甲基化、基因结构、启动子的一些概念 - 简书 (jiansh...
根据某一列中的重复值,删除相应行,最常出现在多组学数据的处理当中。在处理转录组数据时,通常多个芯片对应一个基因,那么注释之后就会遇到一个棘手的问题: gene name中有重...
在上一篇广义线性模型一(Generalized Linear Models,GLM) - 简书 (jianshu.com)[https://www.jianshu.com/p...
survival包最早1985年开始撰写并应用在生存分析,包中有许多数据集供我们学习使用(肺癌、膀胱癌,急性白血病、糖尿病等),功能多样,包括对生存数据的描述、假设检验、co...
参考从线性模型到广义线性模型(1)——模型假设篇 | 统计之都 (cosx.org)[https://cosx.org/2011/01/how-does-glm-genera...
@jijitoutou 样本的名字对应的意义不同,如01,02虽然代表的都是肿瘤样本,01代表的是原发,02是复发,如01A,01B都代表肿瘤,但B代表的是蜡块包埋,测序效果并不佳。所以肿瘤样本我们常常只用0A
具体可以参考https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes
TCGA数据下载方式知多少一、GDC client下载 1.从网页选择数据,下载manifest文件 数据存放网站:https://portal.gdc.cancer.gov/[https://por...
准备开始突变数据的探索时,发现无法读取? 我又去UCSC上找,发现下载raw data就行了, 位置如下:
第一篇我们主要关注了根结点及内部结点的选择第二篇主要关注如何处理“过拟合”现象参考 大致了解机器学习——AI 算法 归档 - 产品经理的人工智能学习库 (easyai.tec...
第一篇我们深入浅出的谈谈决策树,严格来说,是决策树的基本原理。参考 GitHub - datawhalechina/pumpkin-book: 《机器学习》(西瓜书)公式推导...
P53基因在超过50%的肿瘤中发生突变 一、P53基因和蛋白的结构和功能 结构 P53基因位于17号染色体的短臂上,编码的蛋白有393个氨基酸残基。P53之所以为P53,是因...
To ensure proper use of this large clinical dataset associated with genomic features, w...
一、GDC client下载 1.从网页选择数据,下载manifest文件 数据存放网站:https://portal.gdc.cancer.gov/[https://por...
apply()函数是一个很R语言的函数,可以起到很好的替代冗余的for循环的作用,在一篇博客里面介绍过,R语言的循环操作for和while,都是基于R语言本身来实现的,而向量...
@jijitoutou 这里的分组是我自定义的分组(高危组及低危组),当然您可以自定义自己的分组,这个分组并不影响绘图
CIBERSORT计算免疫浸润程度读CIBERSORT免疫浸润的代码实现[https://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247490638&id...
遇到的问题: 生存分析进行过程中,一直发生报错,代码及 错误如下: ggsurvplot(fit)Error in data.frame(..., check.names =...