1.确定好研究方向后,开始下载数据之后,观察下载的数据大体分布,特别样本量不是很大的时候,记得去除异常值。
2.微RNA (miRNA) 是一种靶向多种mRNA 并通过触发翻译抑制和/或 RNA 降解来调节基因表达的非编码小RNA 分子。也就是miRNA的靶基因是mRNA,mRNA是唯一的编码RNA,miRNA,LncRNA是非编码RNA。例如miRNA——调控DNA转录——结合mRNA导致基因沉默——导致靶基因下调。
3.所有数据库提供的都是RNA(基因)表达谱,可以通过R中的Tinyarray包找到对应的LncRNA,详情见 https://gitee.com/swcyo/tinyarray
如何预测和鉴定miRNA的靶基因?
详情见: https://zhuanlan.zhihu.com/p/110357532
研究思路
1.基因两两配对后建模型除了贪婪算法组合出最佳组合外,也可以通过Lasso算法,建出一个有系数的基因对模型,这样可以画出3年或者5年的ROC曲线,临床疗效评估,3年不复发:临床认为基本治愈;5年不复发,:临床上认为完全治愈。这也是算AUC的意义所在。
KM曲线cutoff值怎么确定
https://www.jianshu.com/p/11d2cf8d1e28