多细胞
1、多细胞是怎样产生的?
2、为什么要去除多细胞或若是不去除多细胞对后续分析有何影响?
3、去除双/多细胞是在分析的哪一步进行,质控前还是质控后?
4、列举去除双/多细胞的软件和简单描述算法过程?
5、怎样评估去除多细胞的结果,一是纵向比较,比如不去除多细胞后续分析得到结果,去除多细胞后续分析得到结果,然后后者咋就比前者好了;二是横向比较,相当于软件测评,这个软件得到的结果咋就比那个软件好/坏;上述主要的评价指标是什么?
PCA
流程思维:
1、如何自动选择最优PCs用于下游分析?
2、有哪些方法思路或软件可以用?
3、结果评估?
https://hbctraining.github.io/scRNA-seq/lessons/elbow_plot_metric.html
任务:DoubletFinder流程封装成一个R包,顺便学习R包怎么写。
单细胞聚类最优cluster或分辨率选择,自动化
1、silhouette width
2、clustertree
3、auc
4、graph modularity
相当于聚类算法中确定聚类中心的个数及评估
Calinski Harabasz index
肘方法(误差平方和 SSE)
蒙特卡洛方法
戴维森堡丁指数(DBI) davies_bouldin_score
Compactness(紧密性)(CP)
Separation(间隔性)(SP)
Dunn Validity Index (邓恩指数)(DVI)