应该在他这篇文献的附录里
文献:DOSE: an R/Bioconductor package for disease ontology semantic and enrichment analysis文献时间 2015 摘要 DO以疾病的形式来对人类的基因进行注释,对于联系高通量数据与临床数据有很重要的作用。DOSE是一个R包,提供基因和DO术语之间的语义相似度计算,使生...
应该在他这篇文献的附录里
文献:DOSE: an R/Bioconductor package for disease ontology semantic and enrichment analysis文献时间 2015 摘要 DO以疾病的形式来对人类的基因进行注释,对于联系高通量数据与临床数据有很重要的作用。DOSE是一个R包,提供基因和DO术语之间的语义相似度计算,使生...
@inputzlx 这个都差不多吧,我也都是从相关文献看的
文献:Cancer Statistics,2018文献时间 2018 摘要 每年,美国癌症协会估计美国各州将会新增加的癌症例和死亡例,然后将最新数据通过癌症发生率,死亡率,存活率进行整合。癌症发生的数据子2014年开始,由S...
@inputzlx 这个没注意
文献:Prognostic Genes of Breast Cancer Identified by Gene Co-expression Network Analysis文献时间 2018 摘要 这篇文章的目的是鉴别潜在的与乳腺癌发病相关的基因。使用WGCNA来建立加权共表达网络来探索临床特征和基因集之间的关系,以及来鉴定候选的生物标记基因。...
谢谢你的疑问。就是我感觉这类似硬阈值,我就会觉得为什么就是0.8来作为阈值,0.75行不行,0.85行不行,阈值选取没有一个标准,让人感觉就是为了选取而选取的。只是个人观点,如果很多人用,可能有人经过多次尝试,经验上得到这个阈值比较好,也算有个说法。
文献:Prognostic Genes of Breast Cancer Identified by Gene Co-expression Network Analysis文献时间 2018 摘要 这篇文章的目的是鉴别潜在的与乳腺癌发病相关的基因。使用WGCNA来建立加权共表达网络来探索临床特征和基因集之间的关系,以及来鉴定候选的生物标记基因。...
文献时间 2018 摘要 每年,美国癌症协会估计美国各州将会新增加的癌症例和死亡例,然后将最新数据通过癌症发生率,死亡率,存活率进行整合。癌症发生的数据子2014年开始,由S...
文献时间 2016 摘要 癌症的发生率和死亡率逐渐升高,已经成为国内造成死亡的主要原因,也是目前社会的主要健康问题。因为中国人口数目巨大(13.7亿),所以使用1990年后的...
文献时间 2017 摘要 背景 乳腺癌是一种十分长且而且严重的癌症,世界范围内的女性都收到其伤害。对于乳腺癌,已经有了基因表达的分析,但是基因共表达的分析手段仍然很少。我们尝...
文献时间 2018 摘要 这篇文章的目的是鉴别潜在的与乳腺癌发病相关的基因。使用WGCNA来建立加权共表达网络来探索临床特征和基因集之间的关系,以及来鉴定候选的生物标记基因。...
文献时间 2015 摘要 DO以疾病的形式来对人类的基因进行注释,对于联系高通量数据与临床数据有很重要的作用。DOSE是一个R包,提供基因和DO术语之间的语义相似度计算,使生...
摘要 测序产生的数据内容为,每个样本中,每个基因分配到多少个测序片段,各种类型的测序(RNA-seq,CHIP-Seq,HiC)产生的数据类似。RNA-seq数据分析的一个基...
文献时间 1999 摘要 KEGG (Kyoto Encyclopedia of Genes and Genomes)是一个用于基因功能系统分析的数据库,将基因组信息与更有序...
准备工作 这里进行包的导入 基因ID类型的转换 bitr转换 参数: x:基因ID向量 fromType:目前基因ID类型 toType:目的转换ID类型,可通过向量模式表示...
文献时间 2005.08 摘要 RNA表达数据的分析越来越普遍,从中提取生物相关的信息是一个很大的挑战。我们提供了一种方法,叫做基因集富集分析(GSEA),用来实现这个目标。...
文献时间 2011 摘要 转录组和蛋白组测序数据不断增多,这就需要一个综合的分析策略。我们在此提供了一个R包,clusterProfiler,它将基因簇的富集分析和功能描述查...
文献时间 2000.5 摘要 已经通过测序知道,生物学核心功能的相关基因是共享的,其对应蛋白质的功能在物种之间也有很高的相似度。Gene Ontology Consortiu...
间隔与支持向量 分类任务中,最基本的思想就是通过超平面,将不同类别的样本分开。 超平面就是一个维空间向维空间的一个投影,它比原来空间少一个自由度。超平面可以通过以下公式描述:...
神经元模型 神经网络指由具有适应性的简单单元组成的广泛并行互连的网络。其中的简单单元就是神经元,M-P神经元模型是一个经典并且沿用至今的模型,对于一个神经元:其中代表其他神经...
基本流程 决策树是一种常用的机器学习方法,过程类似于树状结构每一层通过对属性进行决策来进行分类。 结构主要有:根节点(初始的所有数据集),内部节点(初步决策结果),叶节点(最...
基本形式 公式表示:特点有:形式简单,易于建模,容易解释。 线性回归 线性回归的目的就是学得一个线性模型尽可能准确的预测实际输出标记,这个过程可以称为线性回归。 给定一个数据...
经验误差与过拟合 首先在分类机器学习中,引入了两个概念,错误率:分类错误的样本数占总样本数的比例。其表达式为:。其中a为分类错误样本数,m为总样本数。与之相对应的就是精度:分...