问题描述
我尝试在某一细菌全基因组中扫描某一功能基因的conserved motif,工具为MEME平台的FIMO模块。结果显示出报错信息,大意为蛋白序列包含不能识别的氨基酸U,分析无法继续进行。
解决办法
直接将U替换为X,或者删除含有U的序列片段(在不影响目标蛋白序列分析的前提下)。
问题延伸
生物化学课本写道,氨基酸U为22种已知蛋白质氨基酸的一类,名为硒代半胱氨酸。其与吡咯赖氨酸O一起,被视为20种常见蛋白质氨基酸之外的特殊氨基酸。硒代半胱氨酸参与含硒蛋白质的合成,与碘缺乏症(克山病)有关。可能由于其是新发现的,因此似乎不能为一些软件或软件的较老版本所识别。比如,在使用FIMO平台的本地版时,软件直接将U替换为X,并返回最终结果;而在FIMO的在线版本上,U的存在直接无法分析。