RDKit|支持RDKit的PostgreSQL环境搭建与基本操作

  • 一、环境配置
    • 1.windows下的安装与初始化
    • 2.用户设置与服务启动
  • 二、操作使用
    • 1.cmd操作
    • 2.python操作

一、环境配置

PostgreSQL是一个开源、可扩展的关系型数据库,rdkit官网文档里也是以postgresql作为案例进行演示。本文介绍带rdkit插件的postgresql在windows系统上的环境配置,以及在python环境下的基本操作。

1.windows下的安装与初始化

  • 直接在cmd下使用conda安装继承了rdkit插件的postgresql
C:\Users\Administrator> conda install -c rdkit rdkit-postgresql
  • 安装完成后需要初始化一下,在"-D"后加上数据库的数据存储目录
C:\Users\Administrator> initdb –D d:\postgresql\data

2.用户设置与服务启动

  • 安装完成后,直接在cmd中执行“postgres -D d:\postgresql\data”启动服务会出现如下提示,即不能用带管理员权限的用户来启动服务
Execution of PostgreSQL by a user with administrative permissions is not permitted.
  • 接下来在cmd命令行中进行用户设置,这部分内容会被360报错,需要暂时关闭杀毒软件或手动操作
  • 新建一个用户postgres
C:\Users\Administrator> net user postgres /add
  • 激活该用户
C:\Users\Administrator> net user postgres /active:yes
  • 在<password>中设置密码
C:\Users\Administrator> net user postgres <password>
  • 切换到postgres用户,并根据提示输入上一步中设置的密码
C:\Users\Administrator> runas /user:postgres cmd
  • 在弹出的新窗口中启动postgresql服务
C:\Users\Administrator> postgres -D d:\postgresql\data
  • 服务启动成功,可以在cmd或python中操作数据库了


    1

二、操作使用

1.cmd操作

  • 再打开一个cmd终端,创建一个新数据库命名为mols(需要添加conda的环境变量)
C:\Users\Administrator> createdb mols
  • 为数据库加载rdkit扩展模块
C:\Users\Administrator> psql –c “create extension rdkit” mols
  • 进入mols数据库的交互界面.
C:\Users\Administrator> psql mols
  • 操作失误还可以删除数据库.
C:\Users\Administrator> dropdb mols

2.python操作

  • 这里选择psycopg2库用于连接postgresql,同样使用conda安装psycopg2
C:\Users\Administrator> conda install -c conda-forge psycopg2
  • 接下来导入psycopg2,并创建一个connection连接:connect()
    database:设置连接数据库的名称
    user:用户
    password:密码
    port:端口号,默认5432
    host:宿主ip
>>> import psycopg2
>>> connection = psycopg2.connect(database='mols',
>>>                               user='Administrator',
>>>                               password='postgresql',
>>>                               port='5432',
>>>                               host='127.0.0.1')
>>> type(connection)
psycopg2.extensions.connection
  • 创建一个游标cursor,在内存中开辟一块区域,用于存储数据操作的结果:connection.cursor()
>>> cur = connection.cursor()
>>> type(cur)
psycopg2.extensions.cursor
  • 执行一条SQL语句测试一下,查看操作用户
>>> cur.execute("select * from current_user;")
>>> reply = cur.fetchall()
>>> reply
[('Administrator',)]
  • 写一条postgresql语句,记为query,创建一个数据表,命名为info,并表添加列名,设置数据格式
  • 使用游标来执行语句:execute(query)
>>> query = '''create table info(id serial primary key,
>>>                              database text,
>>>                              project text,
>>>                              SMILES text,
>>>                              HA integer,
>>>                              HD integer,
>>>                              RB integer,
>>>                              MW float,
>>>                              LOGP float);'''
>>> cur.execute(query)
  • 读取1000条左右的数据
>>> import pandas as pd
>>> df = pd.read_excel('ippin.xlsx')

获取mol对象列表

>>> from rdkit import Chem
>>> mol_list = [x for x in [Chem.MolFromSmiles(i) for i in df.SMILES] if x]
>>> len(mol_list)
1351

创建一个描述符计算对象,将类药五规则设置到计算器中,这部分不明白的可以参考这篇文章

from rdkit.ML.Descriptors import MoleculeDescriptors
des_list = ['MolWt', 'NumHAcceptors', 'NumHDonors', 'MolLogP', 'NumRotatableBonds']
calculator = MoleculeDescriptors.MolecularDescriptorCalculator(des_list)
  • 使用计算器,对每个分子计算所需描述符
>>> feat_list = ['%s'%str(calculator.CalcDescriptors(mol)) for mol in mol_list]
  • 在query中写入一条向数据表info插入数据的语句,并执行该语句
>>> query = "insert into info (MW, HA, HD, LOGP, RB) values %s" % (','.join(feat_list))
>>> cur.execute(query)
  • 通过聚合函数count(*)看一下有多少条结果
  • 通过游标获取查询结果:fetchall()
>>> query = 'select count(*) from info'
>>> cur.execute(query)
>>> reply = cur.fetchall()
>>> reply
[(1351,)]
  • 最后操作完后,记得提交对数据库的修改:commit()
>>> connection.commit()

本文参考自rdkit、postgresql安装文档
python代码及源文件在这里

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352