接2018年12月31日:
11.筛选后的数据分析:使用筛选软件MaGeCK,根据所有gRNA的平均log2倍数改变(LFC)和错误发现率(FDR)确定最佳基因。为了鉴定筛选中富集或耗尽的显著通路,使用超几何分布统计来计算具有最佳阳性筛选或阴性筛选基因的重叠基因集(|LFC|>2且FDR<0.05)。根据MSIgDB(分子特征数据库),每个通路中包含的基因。
MSigDB数据库中收录了大量已知的基因集,通过使用MSigDB数据库对超几何统计计算出的基因集进行分析,可以得到每个通路中包含的基因。
下图为文献中的figure1.图中BCD图是筛数据进行gRNA 表现度测序后使用MaGeCK,超几何分布和MSIgDB对测序数据进行分析,得出的结果图。B和C基因表达差异的火山图分别表示富集和消耗gRNA的基因的差异表达,纵坐标中-和横坐标log2fold change。当log2 FC绝对值大于2时,才表示基因表达差异有意义。图中D为MSIgDB分析得到的通路及其通途中包含的基因,横坐标表示通路,纵坐标表示通路中的基因,同样Log2FC绝对值大于2才有意义。A图则表示筛选流程的图解。
12,对筛选得到的基因及其通路进行筛选验证。根据以下标准进行验证:(1)|LFC|>2,(2)FDR <0.05,和(3)已知的人类同源物。如上所述产生用于微型池gRNA文库的慢病毒,并且将低MOI用于验证筛选(MOI=0.08)。Pmel-1和OT-I筛选如针对基因组规模筛选如所述进行,其表示(细胞数/gRNA>5,000。对于Pmel-1和OT-I筛选,在从培养物中去除T细胞之前,将B16F10细胞和T细胞分别共培养3天和1天。在具有OT-I T细胞的验证筛选中加入Ova肽。从T细胞去除后再生的细胞中提取基因组DNA,并如上所述量化gRNA表现度。使用微型gRNA文库进行验证,并对gRNA表现度进行测序。结果:初筛得到的基因中大多数鉴定的基因(313个基因中的253个基因)及其通路在二次筛选中进行了验证。