CADD (Combined Annotation–Dependent Depletion) 是一种基于 logistic 回归模型的评分系统,用于预测人类基因组中遗传变异的...

CADD (Combined Annotation–Dependent Depletion) 是一种基于 logistic 回归模型的评分系统,用于预测人类基因组中遗传变异的...
annovar作为老牌变异注释软件,用起来还是挺方便的,速度也挺快,可以输出txt格式的结果,是一个不错的选择。支持的输入格式有pileup、cg、cgmastervar、g...
微卫星 (Microsatellite) 通常由1-6个碱基为重复单元串联重复很多次形成,其位点遍布于基因组。在 DNA 复制负责错配修复 (MMR) 基因的功能存在缺陷时,...
染色体SV (Structural Variation)变异包含Insertion、Deletion、Duplication、Inversions、Translocation...
Rank Biased Overlap (RBO) 是一种用于评估两个排序列表相似度的指标,适用于不完整或部分重叠的排序列表,能够处理不同长度的列表,并在计算中引入衰减因子以...
有人问:用R绘图时看着一切都挺好,可是保存后打开图片一看,字体等内容会变得不协调。这个时候,最简单的方式就是调整保存图片的大小,可能来来回回需要好多次,保存的图片内容才会协调...
远程使用服务器资源的时候,运行任务通常都是提交给集群统一调度。但有时候也会选择本地化执行,如果这个任务需要运行很长的时间,一般会使用nohup命令将任务挂后台运行,这样即...
前面体验过presto包赋能Seurat在大数据集做差异分析的提升,详情见Seurat | 解决了FindAllMarkers在大数据集上的速度短板[https://mp...
ggsave 保存图片时,PDF、PNG、JPEG 等不同格式的尺寸设置方式不同,主要是因为它们的单位和分辨率不同。为了让这些格式的图片尺寸保持一致,需要根据分辨率和单位进行...
Seurat作为知名的单细胞数据分析框架,虽然很好用,但在大数据集一直存在速度上的短板,尤其在FindAllMarkers。所以其一直也在试图解决,比如通过引入featu...
虽然目前有很多语言模型可以替代人工写代码,但并不总是可以直接复制可用,有时候还是需要人工修改以完善可用。拥有学习能力,数据处理并没有会与不会,而是处理上的难易程度最终以花...
两分组的交集差集可视化最常用的方法就是韦恩图,复杂点如果分组超过5组可以换成upset图展示。虽然也是两分组,但如果有多个分类时韦恩图就不是好的选择了。此时,回到最简单的...
Seurat的FeaturePlot可以展示基因在降维空间里各个分群的表达情况,也可以展示metadata里面的数据情况,例如基因集打分情况。虽然这个函数绘图好用,但是对...
每当需要做热图的时候,首先想到就是pheatmap。记不清啥时候第一次使用该包了,但从那以后这就是画热图的第一选择了,因为无论是功能,还是颜值,亦或是操作简易程度都可以算...
数据处理时经常需要做各种处理,如标准化和归一化,在R里面可以借助scale函数来轻松完成。默认情况下,该函数做的事情可以用下面的公式概括:其中 x 是原始数据点,μ 是数...
好看的图当然会锦上添花,单细胞美化的包很多,也各有特色,不妨收藏几个,方便以后事半功倍地画出漂亮的图。 scplotter[https://pwwang.github.io/...
分析空间转录组数据的时候,简单地学习了一下MISTy模型框架:一个灵活扩展,可解释的机器学习框架,可用于从任何空间组学数据中提取关系,可同时评估数十到数千个marker。...
TCellSI:一款借助Mann-Whitney U统计量,通过特定marker基因集和背景基因,对T细胞状态进行评估打分的软件。该软件能够准确评估T细胞的八种不同状态分...
基因翻译,即遗传密码从转录本到蛋白质的过程,也是功能基因能够发挥自身作用前的必经之路。基因的翻译效率收到很多因素的调控,这其中最直接的是基因本身的转录丰度,正常情况下,翻...