mol2文件分子名称的批量修改

1. 目的及思路

   一般软件在读取 *.mol2 文件时,依据文件内部的标注确定分子名称,而非文件名。*.mol2 文件结构(仅展示包含分子名称的前几行)如下图所示,#为首的行是Sybyl软件生成的注释,可以看到,分子名称在该文件的第9行(不一定),即@<TRIPOS>MOLECULE的下一行(一定),该分子名为IAA。

#   Name:           IAA
#   Creating user name: XiyangLee
#   Creation time:      Wed Jun 19 15:25:24 2019

#   Modifying user name:    XiyangLee
#   Modification time:  Wed Jun 19 15:27:21 2019

@<TRIPOS>MOLECULE
IAA
   22    23     1     1     0
SMALL
GAST_HUCK


@<TRIPOS>ATOM
      1 C1         -0.7976   -6.3164   -0.6615 C.2       1 BENZYL      0.0193 
      2 N2          0.2258   -5.7519   -0.0713 N.pl3     1 BENZYL     -0.2884 
      3 C2          1.3929   -6.1123   -0.6404 C.ar      1 BENZYL      0.0606 
      4 C3          1.1440   -6.9808   -1.6852 C.ar      1 BENZYL     -0.0193 
...

  为了使软件正确读取我们所希望的分子名称,我们在修改分子名称时需要将 *.mol2 文件内的名称一并修改。本文所介绍方法的思路为:1. 利用cmd批量修改 *.mol2 文件名;2. 利用Python读取文件名并替换文件内的旧分子名。

2. 操作方法

2.1 批量修改 *.mol2 文件名

  考虑到批处理对象数目一般较为庞大,我们首先从获取文件名称开始。

  在*.mol2文件所在目录新建一个txt文件,输入dir /a-d /b *.mol2* >>文件名.txt,保存后修改该文件后缀为bat,双击执行该bat文件,即可获得该目录下所有*.mol2文件的名称;

  新建一个Excel文件,在第二列粘贴需要修改的文件名,第一列的单元格填充ren,第三列输入修改后的文件名称,与第二列一一对应,如图1所示;随后将该文件另存为csv文件;

图1:Excel文件结构

  使用Notepad++(或其他文本编辑器)打开保存的csv文件,将所有的,替换为(空格),这样每一行都符合cmd修改文件名的语法格式:ren oldname.xxx newname.xxx,保存后将文件名后缀csv改为bat,双击执行即可批量修改该目录下的 *.mol2 文件名。

2.2 批量修改 *.mol2 文件内的分子名称

  新建Python文档,输入并执行以下代码即可。

import os
import re

path = "C:/Users/Admin/Jupyter/MolecularRename/All" # \*.mol2 文件所在文件夹目录,注意删除非mol2文件
files = os.listdir(path) #得到文件夹下的所有文件名称
s = []
for file in files: #遍历文件夹
    if not os.path.isdir(file): #判断是否是文件夹,不是文件夹才打开
        f = open(path+"/"+file,"r+"); #打开文件
        iter_f = iter(f); #创建迭代器
        new=[]
        for line in iter_f: #遍历文件,一行行遍历,读取文本
            new.append(line)
        newname = "".join(re.findall(r'(.+?)\.mol2',file)) #将文件名作为分子名称;"".join():将list转为str;r'(.+?)\.mol2':去除文件名后缀;
        new[0]= '#  Name:           '+ newname +'\n'
        new[8]= newname + '\n'
        f.seek(0)
        for n in new:
            f.write(n)
        f.close()
print('Work done.')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 个人学习批处理的初衷来源于实际工作;在某个迭代版本有个BS(安卓手游模拟器)大需求,从而在测试过程中就重复涉及到...
    Luckykailiu阅读 4,960评论 0 11
  • 在进行文件批量处理的过程中,总是不可避免的会遇到批量修改文件名称的问题,例如对文件夹名称的修改,对文章中配图...
    _Frank_Lee_阅读 3,364评论 2 6
  • 基础用法 批量修改文件名不是很容易吗?只需要使用第三方工具不就可以了吗?为什么还要使用Excel? 因为这次我们要...
    五月小闲人阅读 14,646评论 0 14
  • 在学习工作中,经常会需要将文件夹名称批量修改,并且每个文件夹名称需要改为指定的名称,单个修改效率太低,现将批量修改...
    鲸鱼_eba8阅读 49,414评论 3 9
  • 朋友们,大家周一好。 今天,我早早地驱车来医院就诊,现在已经十点半,在我前面还有二十多个病人在焦急地等待。 大家议...
    泺伊悦尔阅读 228评论 0 2

友情链接更多精彩内容