随缘记录自己看到的一些文章文献以及一些工具,又因为主要内容和生信可能比较相关,写作随缘,更新随缘,故名缘信,过去的一周为第47周,为本刊第一周
文章
Temporal Dynamic Methods for Bulk RNA-Seq Time Series Data
大容量 RNA-Seq 时间序列数据的时间动态处理方法
Temporal Dynamic Methods for Bulk RNA-Seq Time Series Data (nih.gov)
这是一篇主要记录了能够使用RNAseq能够进行动态时间分析的工具的综述。探索某种特定因素对RNA表达随时间的变化有着一定作用
摘要
动态研究的时程实验设计和临床方法已被广泛应用于生物医学界。这些应用特别适用于环境条件下的刺激-反应模型、角色塑造生物学过程的发育生物学、临床试验中的治疗效果鉴定、疾病进展模型、细胞周期和昼夜周期。尽管复杂的动态方法具有可行性和普及性,但与静态方法相比,这些方法在大规模比较研究中得到了充分验证,在统计和计算的严谨性方面缺乏基准。到目前为止,已经发展了一些新的方法在批量 RNA-Seq 数据为各种时间依赖性刺激,昼夜节律,细胞谱系的分化,和疾病进展。在这里,我们全面回顾了一组关键的代表性动态策略,并讨论了与动态变化基因检测相关的当前问题。我们也为未来研究非周期性、周期性时程数据和元动态数据集的方向提供了建议。
非周期性时间过程 RNA-Seq 数据的动态基因逐基因(基因方向)检测工具。
![[Pasted image 20211122173303.png]]
Identifying phenotype-associated subpopulations by integrating bulk and single-cell sequencing data
通过整合bulk and single-cell 测序数据识别表型相关亚群
说明:主要是用于整合单细胞和RNAseq的数据
github地址
sunduanchen/Scissor: Scissor package (github.com)
使用:
Scissor Tutorial (sunduanchen.github.io)
单细胞 RNA 测序(scRNA-seq)在异质组织中区分细胞类型、状态和谱系。然而,目前的单细胞数据不能直接链接具有特定表型的细胞群。在这里,我们提出Scissor,一个方法,确定细胞亚群从单细胞数据,是与给定的表型。Scissor 通过首先量化每个单细胞和每个批量样本之间的相似性,集成了表型相关的批量表达数据和单细胞数据。然后在样本表型相关矩阵上优化回归模型,以识别相关亚群。应用于肺癌 scRNA-seq 数据集,Scissor 确定了与较差存活率和 tp53突变相关的细胞亚群。在黑色素瘤中,Scissor 发现一个低 PDCD1/ctla4和高 tcf7表达的 t 细胞亚群与免疫治疗反应有关。除了癌症外,Scissor 在解读面肌萎缩症和阿尔茨海默病数据集方面非常有效。Scissor 通过利用表型和整体组学数据集,从单细胞分析中确定生物学和临床相关的细胞亚群。
![[Pasted image 20211122174524.png]]
Nat. Methods | 一个可解释可推广的单细胞数据分析框架
Nat. Methods | 一个可解释可推广的单细胞数据分析框架 (qq.com)
本文介绍由德克萨斯大学生物信息学系和Lewis-Sigler基因组学研究所联合发表于Nature Methods的论文:An analytical framework for interpretable and generalizable single-cell data analysis. 该论文提出了一种新颖的“linearly interpretable”框架,它将线性方法的可解释性与非线性方法的表征能力相结合。在这个框架内,作者介绍了一种数据表示可视化方法GraphDR 和一种结构发现方法StructDR,它能够实现聚类、轨迹分析、表面估计和置信集推断。
课程
复现
使用PHATE复现Science Immunology上文章的结果 (qq.com)
里面有python3D的绘制技巧
![[Pasted image 20211122211950.png]]
绘图技巧
配色
生信实操丨只需学会这几招,让你的单细胞测序分析图向CNS看齐! (qq.com)
配色很重要
![[Pasted image 20211122212242.png]]
数据库
用好数据库,文章发到吐 (qq.com)
****1.CeDR Atlas: 细胞药物应答知识库**
2.CTR-DB:一个与癌症药物反应相关的基因表达特征综合数据库
3.CancerMIRNome:人类癌症miRNA交互式分析与可视化数据库
4.Regeneration Roadmap:再生生物学多组学数据资源库
5.Gene Expression Nebulas:整合多物种的bulk与单细胞转录组数据库
6.OncoSplicing:人类癌症中临床相关的可变剪接数据资源库
7.SPENCER:癌症病人非编码RNA编码的生物活性短肽数据库
**8.TISMO:肿瘤免疫同基因小鼠****
群落相似性/或距离测度
常见的群落相似性或距离测度的计算 (qq.com)
编程语言语法比对
包的开发
这是一个处理m6A数据的包,但是让人感兴趣的是下面这行代码会直接生成一个html文件,那么是如何做到的呢?
trumpet_report <- Trumpet_report(IP_BAM = ip_bam, Input_BAM = input_bam, contrast_IP_BAM = contrast_ip_bam, contrast_Input_BAM = contrast_input_bam, condition1 = "untreated", condition2 = "treat, GENE_ANNO_GTF = gtf)
查看trumpet_report函数
Trumpet/Trumpet_report.R at master · skyhorsetomoon/Trumpet (github.com)
在里面我们很容易发现这个是怎么回事了,这个只是在判断有没有输入的文件,如果有相应数据就可以将数据保存为Rdata而已
不过很聪明的使用了rmarkdown生成html的技巧
trumpet <- system.file("extdata", "Trumpet_report.Rmd", package = "Trumpet")
render(trumpet, output_format = "html_document", output_dir = OUTPUT_DIR)
本质上是在调用下面的文件去运行计算的结果,然后生成html
Trumpet/Trumpet_report.Rmd at master · skyhorsetomoon/Trumpet (github.com)
R语言书单
代码集
文章
特别是一些统计方法,比如随机森林
NRT1.1B is associated with root microbiota composition and nitrogen use in field-grown rice | Nature Biotechnology
microbiota/Zhang2019NBT: Scripts for stat and plot figures in rice microbiome paper (github.com)
手把手带你重现菌群封面文章全部结果图表 (qq.com)
YongxinLiu/Zhang2018SCLS: Rice (Oryza Sative) root microbiome time-course analysis. (Zhang2018SCLS) (github.com)
thekingofall/MicrobiomeStatPlot: Interpretation and visualization of microbiome charts (github.com)
Python包
scikit-bio¶