生信分析中,对软件无法识别的蛋白质序列中U(硒代半胱氨酸)的处理

问题描述

我尝试在某一细菌全基因组中扫描某一功能基因的conserved motif,工具为MEME平台的FIMO模块。结果显示出报错信息,大意为蛋白序列包含不能识别的氨基酸U,分析无法继续进行。

解决办法

直接将U替换为X,或者删除含有U的序列片段(在不影响目标蛋白序列分析的前提下)。

问题延伸

生物化学课本写道,氨基酸U为22种已知蛋白质氨基酸的一类,名为硒代半胱氨酸。其与吡咯赖氨酸O一起,被视为20种常见蛋白质氨基酸之外的特殊氨基酸。硒代半胱氨酸参与含硒蛋白质的合成,与碘缺乏症(克山病)有关。可能由于其是新发现的,因此似乎不能为一些软件或软件的较老版本所识别。比如,在使用FIMO平台的本地版时,软件直接将U替换为X,并返回最终结果;而在FIMO的在线版本上,U的存在直接无法分析。

仅供参考。未经许可请勿转载。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容