RDKit|分子修改与编辑

文章目录

  • 一、初级篇
  1. 氢原子显示与隐藏
  2. 芳香键与kekule式转换
  • 二、高级篇
  1. Atom和Bond对象的编辑功能
  2. RWMol类的编辑功能

一、初级篇

1.氢原子显示与隐藏

正常情况下,分子在rdkit中存储时,氢以隐式氢的形式存储,即不会在图片中显示出来。当需要加入氢原子时,例如要生成和优化立体结构,可以通过函数加上氢原子。

  • 加氢:AddHs()
  • 去氢:RemoveHs()
>>> from rdkit import Chem
>>> m = Chem.MolFromSmiles('CCO')
>>> print(m.GetNumAtoms())
3
>>> m2 = Chem.AddHs(m)
>>> print(m2.GetNumAtoms())
9
>>> m2 = Chem.RemoveHs(m2)
>>> print(m2.GetNumAtoms())
3

2.芳香键与kekule式转换

  • 芳香键在Rdkit中存储类型为"AROMATIC",可以转化为kelule式:Kekulize()
>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> print(m.GetBondWithIdx(0).GetBondType())
AROMATIC
>>> Chem.Kekulize(m)
>>> print(m.GetBondWithIdx(0).GetBondType())
DOUBLE
>>> print(m.GetBondWithIdx(1).GetBondType())
SINGLE

转化后,类型中虽然变为单键和双键,但依然是芳香键

  • 查看是否为芳香键:GetIsAromatic()
>>> print(m.GetBondWithIdx(1).GetIsAromatic())
True
  • 之所以仍然为芳香键,是因为分子有一个跟芳香性相关的属性Flags,记录了芳香性的信息。可以在kelulize时将clearAromaticFlags参数设置为True
>>> Chem.Kekulize(m, clearAromaticFlags=True)
>>> print(m.GetBondWithIdx(0).GetBondType())
DOUBLE
>>> print(m.GetBondWithIdx(1).GetIsAromatic())
False
  • 如果想修改回芳香键,可以对分子进行检查:SanitizeMol()
>>> Chem.SanitizeMol(m)
>>> print(m.GetBondWithIdx(0).GetBondType())
AROMATIC

二、高级篇

1.Atom和Bond对象的编辑功能

在rdkit的Atom对象中也提供了一系列功能,可以对分子进行原位编辑。

  • 修改形式电荷:atom.SetFormalCharge(int)
  • 修改杂化方式为SP3:atom.HybridizationType(Chem.HybridizationType.SP3)
  • 修改为芳香原子:atom.SetIsAromatic(True)
  • 修改为同位素标记原子:atom.SetIsotope(int)
  • 不带隐式氢:atom.SetNoImplicit(True)
  • 固定显示氢:atom.SetNumExplicitHs(int)

Bond对象类似

  • 修改键的显示方式:SetBondDir(Chem.BondDir.BEGINDASH)
  • 修改为芳香键:SetBondType(Chem.BondType.AROMATIC)
  • 修改键芳香性的Flags:SetIsAromatic(bool)
  • 是否共轭:SetIsConjugated(bool)

不挨个说明了,感兴趣可以试试各个函数及相关参数,举几个可能会遇到的例子

  • 修改手性碳:SetChiralTag()
    参数设置为Chem.ChiralType.CHI_TETRAHEDRAL_CCW时,为S型(Counter Clockwise,逆时针)
    参数设置为Chem.ChiralType.CHI_TETRAHEDRAL_CW时,为R型(Clockwise,顺时针)
    还有CHI_OTHER、CHI_UNSPECIFIED不指定类型
>>> m = Chem.MolFromSmiles('OC(N)C')
>>> m.GetAtomWithIdx(1).SetChiralTag(Chem.ChiralType.CHI_TETRAHEDRAL_CW)
>>> m
modifying_mols_0.png
  • 修改原子:atom.SetAtomicNum()
>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> m.GetAtomWithIdx(0).SetAtomicNum(7)
>>> Chem.SanitizeMol(m)
>>> Chem.MolToSmiles(m)
'c1ccncc1'
  • 别忘了检查步骤,虽然有时候看起来没什么问题
>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> m.GetAtomWithIdx(0).SetAtomicNum(8)
>>> Chem.MolToSmiles(m)
'c1ccocc1'
  • 但该分子本身其实是错误的:SanitizeMol()
>>> Chem.SanitizeMol(m)
---------------------------------------------------------------------------
KekulizeException                         Traceback (most recent call last)
<ipython-input-80-8aabfab76642> in <module>
----> 1 Chem.SanitizeMol(m)

KekulizeException: Can't kekulize mol.  Unkekulized atoms: 1 2 3 4 5

2.RWMol类的编辑功能

更复杂的操作可以使用rdkit.Chem.rdchem.RWMol类(用于分子读写的类)。这个类在修改分子方面,性能更好,它可以提供一个“活动的”分子,并且共享了mol对象的操作接口。修改完毕后,只需要用GetMol()就可以获得最终的分子

>>> m = Chem.MolFromSmiles('CC(=O)C=CC=C')
>>> mw = Chem.RWMol(m)
>>> mw
modifying_mols_1.png
  • 替换原子:ReplaceAtom(index, newAtom, ...)
    index:要替换的原子索引
    newAtom:新的原子对象
>>> mw.ReplaceAtom(4, Chem.Atom(7))
>>> mw
modifying_mols_2.png
  • 添加原子:AddAtom(atom)
    atom:要添加的原子对象
    返回值是新添加原子的索引
>>> mw.AddAtom(Chem.Atom(6))
>>> mw.AddAtom(Chem.Atom(6))
>>> mw
modifying_mols_3.png
  • 添加键:AddBond(beginAtomIdx, endAtomIdx, order)
    beginAtomIdx:键的起始原子
    endAtomIdx:键的末尾原子
    order:键的类型
>>> mw.AddBond(6, 7, Chem.BondType.SINGLE)
>>> mw.AddBond(7, 8, Chem.BondType.DOUBLE)
>>> mw.AddBond(8, 3, Chem.BondType.SINGLE)
>>> mw
modifying_mols_4.png
  • 删除原子:RemoveAtom()
    传入原子索引
    每次删除后,索引都会更新
>>> mw.RemoveAtom(0)
>>> mw
modifying_mols_5.png
  • 其他一些操作Mol的方法,对RWMol也同样适用
>>> print(Chem.MolToSmiles(mw))
O=CC1=NC=CC=C1
>>> print(Chem.SanitizeMol(mw))
SANITIZE_NONE
>>> print(Chem.MolToSmiles(mw))
O=Cc1ccccn1
  • 修改完后,可以获取该分子的Mol对象:mw.GetMol()
>>> m_edit = mw.GetMol()
>>> type(m_edit)
rdkit.Chem.rdchem.Mol
  • 大功告成

本文参考自rdkit官方文档
代码及源文件在这里

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352