文献信息
标题:LocTree3 prediction of localization
DOI(url): LocTree3 prediction of localization | Nucleic Acids Research | Oxford Academic (oup.com)
日期及杂志:21 May 2014, Nucleic Acids Research
作者及单位:Tatyana Goldberg, Department of Informatics, Bioinformatics-I12, TUM, 85748 Garching, Germany
文献概述(这篇文献的结论是什么?)
本文提出了一种蛋白质亚细胞定位的预测方法LocTree3。LocTree2应用机器学习(SVM)来预测真核生物18类的亚细胞定位、细菌6类和古细菌3类的原生亚细胞定位,将输出一个预测可靠性的分数。在此基础上,LocTree3做了如下改进:(1)利用PSI-BLAST从具有已知定位的蛋白质中获取注释信息,并将其传递给具有相似序列的未知定位蛋白质。这样可以利用同源蛋白质的信息来预测未知蛋白质的定位;(2)LocTree3使用了一种新的快速的SVM profile kernel方法,优化了运行时间;(3)LocTree3为预测结果提供了GO注释;(4)重复搜索速度更快。LocTree3在性能上优于其他方法,包括Cello2.5、PSORTb3.0、WolfPsort和YLoc。
LocTree3官网:LocTree3 - Protein Subcellular Localization Prediction Server (rostlab.org)
文章亮点(这篇文献的优点在哪?)
LocTree2利用了支持向量机的分层系统,在树的所有层次上都是二元决策,在此基础上LocTree3引入了PSI-BLAST工具,通过查找已知定位的蛋白质中与待预测蛋白质相似的序列,基于序列同源性来推断待预测蛋白质的定位,两个工具结合起来,最终提高了预测结果的准确率。
LocTree3通过一个可靠性指数(RI)来衡量每个预测的置信度
我的疑问(这篇文献的不足在哪?)
基于序列同源性的预测能力有限,忽略了蛋白二级和三级结构的作用
没有对动物和植物进行分类,如果从头预测的结果出现错误,可能会有动物蛋白预测到叶绿体定位的情况的情况
和我相关(我从这篇文献里学到了什么?)
真核生物的18类亚细胞定位分别为:
1.核内(Nuclear) 2.核外(Cytoplasmic) 3. 线粒体膜(Mitochondrial membrane) 4. 内质网膜(Endoplasmic reticulum membrane) 5. 高尔基体膜(Golgi apparatus membrane) 6. 溶酶体膜(Lysosomal membrane) 7. 内质网(Endoplasmic reticulum) 8. 高尔基体(Golgi apparatus) 9. 溶酶体(Lysosome) 10. 核小体(Nucleolus) 11. 核仁(Nucleus) 12. 核膜(Nuclear membrane) 13. 线粒体(Mitochondrion) 14. 叶绿体膜(Chloroplast membrane) 15. 叶绿体(Chloroplast) 16. 高尔基体腔(Golgi apparatus lumen) 17. 溶酶体腔(Lysosome lumen) 18. 细胞外(Extracellular)
真核生物蛋白亚细胞定位预测的结果准确率在80%±3%,在预测真核生物的细胞外蛋白质方面表现最佳(准确率:88%),其次是核蛋白质(准确率:81%)
相关文献(文献扩展,其他补充资料)
Tatyana Goldberg, Tobias Hamp, Burkhard Rost, LocTree2 predicts localization for all domains of life, Bioinformatics, Volume 28, Issue 18, September 2012, Pages i458–i465, https://doi.org/10.1093/bioinformatics/bts390