Title: A multimodal deep learning framework for predicting drug-drug interaction events
原文链接:https://academic.oup.com/bioinformatics/article/36/15/4316/5837109?login=true
1 Aims: DDI events prediction ( Y = 65 DDIs)
早期模型只能判断药物-药物(DD)是否有相互作用(Y = 1,0)。后来可以预测更多的药物相互作用(DDIs),本文利用多个机器学习本文模型耦合预测药物间的相互作用,通过本文构建的模型有较好的预测精度(accuracy:0.8852)。
2 Methology:
2.1 Data & data preprocessing
Data source: Drugbank.
本文数据: 572 drugs
4 Features(chemical structure (S):881; Target:1162 (T); Enzyme (E): 202; Pathway (P):957)
65 DDI events (StanfordNLP creates tuples (drug A, drug B, Mechanism, action)
A. X的预处理:将药物信息转化为矩阵。药物特征信息有化学结构,靶点,酶和通路。对每一个特征形成一个子训练集。Methology: binary feature vector, Jaccard similarity (https://blog.csdn.net/lm324114/article/details/103831311).
B. Y的预处理:在本文DDIs分为65种(Y=65的分类问题)。Methology: StanfordNLPtool
2.2 DL Model
2.1 Sub-models: MLP: bottleneck-like neural network VGG16,
(Activation Function: ReLU, Loss Function: Cross-entropy, Optim: Adam)
2.2 Model combination: average operator
3: Model Application (3 tasks)
task 1. unobserved interactions between known drugs
task 2. interactions between known drugs and new drugs
task 3. interactions between new drugs
4: Evaluation
Accuracy (ACC); Area under the precision-recall-curve (AUPR); Area under the ROC curve (AUC); F1 score; Runing time; Precision; Recall
5: Experiments
1. DNN 模型层数检验
对不同层训练效果进行评估,结果显示3层最好
2. 特征评估
不同特征组合下模型performance对比,选择S+T+E组合最好
3. 方法对比
3.1 DDIMDL(本文模型),DeepDDI (Rye et al., 2018), RF, KNN, LR, DNN (这地方有点不明白用机器学习的方法构建模型,如果没有用多模型他不同的特征是怎么训练的?)
3.2 几种方法对不同研究问题的预测结果对比
3.3 case study
小结:论文结构清晰:背景介绍,数据集构建,模型构建,模型评估。
药特征提取部分,DDIs用到了StanfordNLP和模型结构可以借鉴。模型结构中sub-model combination部分用的是average operator,思考是不是有其他的方法。