pyrosetta2-RosettaScripts

RosettaScripts

RosettaScripts是一种脚本式的自定义模块,通常情况下在Rosetta中应用都是单独存在,需要用户去分别调用。为了满足用户想要同时运行多个脚本和修改多个参数的需求,就产生了基于XML的RosettaScripts。RosettaScripts相比于PyRosetta来说更简单,但是功能确实非常强大的,并且有大量的相关的文献。Rosetta的最新版本中使用Pyrosetta可以运行完整的RosettaScript。

RosettaScripts 的组成

RosettaScripts 的骨架:

<ROSETTASCRIPTS>
    <SCOREFXNS>
    </SCOREFXNS>
    <RESIDUE_SELECTORS>
    </RESIDUE_SELECTORS>
    <TASKOPERATIONS>
    </TASKOPERATIONS>
    <SIMPLE_METRICS>
    </SIMPLE_METRICS>
    <FILTERS>
    </FILTERS>
    <MOVERS>
    </MOVERS>
    <PROTOCOLS>
    </PROTOCOLS>
    <OUTPUT />
</ROSETTASCRIPTS>

上述个模块所表达的意思:

  • ScoreFunctions:通过物理和统计能量项来评估pose的能量得分
  • ResidueSelectors:根据一些标准来选择pose中的氨基酸残基
  • TaskOperations:控制侧链的组装和设计
  • SimpleMetrics:返回pose的一些度量值,可以是数字,字符串等
  • Filters: 为了提升效率,需要在早期采样中对结果进行评估,抛弃一些不合理的结构
  • Movers: 对pose进行操作,通常使用apply()进行操作
  • Protocols: 使用上述的哪一个方法对pose进行操作
  • Output: 输出
    <SCOREFXNS>
    </SCOREFXNS>

    <SCOREFXNS/>

上面的两种方式是等价的

RosettaScripts 的举例

<ROSETTASCRIPTS>
    <SCOREFXNS>
    </SCOREFXNS>
    <RESIDUE_SELECTORS>
        <CDR name="L1" cdrs="L1"/>
    </RESIDUE_SELECTORS>
    <MOVE_MAP_FACTORIES>
        <MoveMapFactory name="movemap_L1" bb="0" chi="0">
            <Backbone residue_selector="L1" />
            <Chi residue_selector="L1" />
        </MoveMapFactory>
    </MOVE_MAP_FACTORIES>
    <SIMPLE_METRICS>
        <TimingProfileMetric name="timing" />
        <SelectedResiduesMetric name="rosetta_sele" residue_selector="L1" rosetta_numbering="1"/>
        <SelectedResiduesPyMOLMetric name="pymol_selection" residue_selector="L1" />
        <SequenceMetric name="sequence" residue_selector="L1" />
        <SecondaryStructureMetric name="ss" residue_selector="L1" />
    </SIMPLE_METRICS>
    <MOVERS>
        <MinMover name="min_mover" movemap_factory="movemap_L1" tolerance=".1" /> 
        <RunSimpleMetrics name="run_metrics1" metrics="pymol_selection,sequence,ss,rosetta_sele" prefix="m1_" />
        <RunSimpleMetrics name="run_metrics2" metrics="timing,ss" prefix="m2_" />
    </MOVERS>
    <PROTOCOLS>
        <Add mover_name="run_metrics1"/>
        <Add mover_name="min_mover" />
        <Add mover_name="run_metrics2" />
    </PROTOCOLS>
</ROSETTASCRIPTS>

我们将其命名为 min_L1.xml ,然后使用pyrosetta去运行他

parser = RosettaScriptsParser()
protocol = parser.generate_mover("min_L1.xml")

protocol.apply(pose)

同样也可以再python中通过XMLObjects 将字符串转换成XML文件

min_L1 = """
<ROSETTASCRIPTS>
    <SCOREFXNS>
    </SCOREFXNS>
    <RESIDUE_SELECTORS>
        <CDR name="L1" cdrs="L1"/>
    </RESIDUE_SELECTORS>
    <MOVE_MAP_FACTORIES>
        <MoveMapFactory name="movemap_L1" bb="0" chi="0">
            <Backbone residue_selector="L1" />
            <Chi residue_selector="L1" />
        </MoveMapFactory>
    </MOVE_MAP_FACTORIES>
    <SIMPLE_METRICS>
        <TimingProfileMetric name="timing" />
        <SelectedResiduesMetric name="rosetta_sele" residue_selector="L1" rosetta_numbering="1"/>
        <SelectedResiduesPyMOLMetric name="pymol_selection" residue_selector="L1" />
        <SequenceMetric name="sequence" residue_selector="L1" />
        <SecondaryStructureMetric name="ss" residue_selector="L1" />
    </SIMPLE_METRICS>
    <MOVERS>
        <MinMover name="min_mover" movemap_factory="movemap_L1" tolerance=".1" /> 
        <RunSimpleMetrics name="run_metrics1" metrics="pymol_selection,sequence,ss,rosetta_sele" prefix="m1_" />
        <RunSimpleMetrics name="run_metrics2" metrics="timing,ss" prefix="m2_" />
    </MOVERS>
    <PROTOCOLS>
        <Add mover_name="run_metrics1"/>
        <Add mover_name="min_mover" />
        <Add mover_name="run_metrics2" />
    </PROTOCOLS>
</ROSETTASCRIPTS>
"""


xml = XmlObjects.create_from_string(min_L1)
protocol = xml.get_mover("ParsedProtocol")

protocol.apply(pose)

也可以通过XMLObjects 创建一个单独的section

L1_sele = XmlObjects.static_get_residue_selector('<CDR name="L1" cdrs="L1"/>')

创建的XML文件是这样的

<ROSETTASCRIPTS>
    <RESIDUE_SELECTORS>
        <CDR cdrs="L1" name="L1"/>
    </RESIDUE_SELECTORS>
    <PROTOCOLS/>
</ROSETTASCRIPTS>

总结

RosettaScripts 无论是在pyrosetta还是在rosetta中的使用频率都是非常之高的,如果关注Baker lab的文章的话,会发现当他们使用rosetta的时候,大部分都是以XML为基础将各种应用串起来的,例如 FastDesign,Motif-Graft等等,所以想要学好rosetta,XML的书写和使用是不能绕过的一步(这句话也是写给我自己的)。

参考

RosettaScripts更详细的解释和教程:Creating protocols with RosettaScripts (rosettacommons.org)
知乎上的大神同样对此做了非常详尽的解释:RosettaScripts基础教程中译 - 知乎 (zhihu.com)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容