摘要
人工智能的发展正在全面推动我们的生活
新药研发过程中初始命中率低导致的成本升高是制药行业亟需解决的问题
制药行业正在尝试与人工智能研究者合作来解决这一问题
人工智能将提高药物开发过程的效率
介绍
人工智能(AI)是计算机对人类智能过程的模拟。该过程包括获取信息、制定使用信息的规则、得出近似或确定的结论以及自我校正。尽管有许多人担心人工智能的广泛应用会造成大规模的失业,但不可否认,从创新的教学方面到商业和工业流程自动化,人工智能已经被广泛应用于各个领域。在药物开发过程中采用AI的新思想已经从炒作变成了希望。这篇文章介绍了人工智能在药物开发策略和过程等环节能起到的作用。
人工智能、机器学习和深度学习
在发现类药物小分子中使用AI的方法涉及化学空间的利用。通过计算枚举可能的有机分子,化学空间为鉴定全新的优质分子提供了舞台。此外,机器学习技术和预测模型软件还有助于识别目标特异性虚拟分子,以及分子与各自目标的关联,同时优化安全性和功效属性。
人工智能系统可以通过减少之后在体外或体内系统中测试的合成化合物的数量来降低损耗率和研发支出。经过验证的AI技术可用于提高药物开发的成功率,而正在开发中的AI技术必须在应用于药物开发过程之前进行验证。药物开发过程中最关键的部分是所选分子的合成。因此,人工智能具有很高的价值,因为它能够根据合成的难易程度对分子进行优先排序或开发出对最佳合成途径有效的工具。
AI在合成类药物化合物中的意义
图1简明地显示了AI在医疗行业中的整合。
说起人工智能辅助新药研发,就不得不提到人工智能的子领域机器学习(ML)。1959年,机器学习的先驱之一亚瑟·萨缪尔(Arthur Samuel)将机器学习用作研究领域,使计算机无需进行显式编程即可学习。
机器学习分为监督学习、无监督学习和强化学习。监督学习包括分类和回归方法,其中基于来自输入和输出源的数据来开发预测模型。监督性机器学习的输出需要在亚组分类下进行疾病诊断;以及药物功效和亚群回归下的ADMET预测。无监督学习包括通过仅基于输入数据对数据进行分组和解释来进行聚类和特征查找的方法。通过无监督的机器学习,可以实现诸如从聚类中发现疾病亚型和从特征发现方法中发现疾病目标的输出。强化学习主要由给定环境中的决策及其执行以最大程度地发挥其性能来驱动。这类ML的输出包括决策中的从头药物设计和执行中的实验设计——两者都可以通过建模和量子化学来实现。ML的另一个子领域是深度学习(DL),通过建立可以模拟人脑进行分析学习的神经网络,让它模仿人脑的机制来解释数据。大数据及关联数据挖掘算法方法可以为我们提供发现可能是新药的新化合物,发现或重新使用单独或组合使用时可能更有效的药物的能力,并基于遗传标记改善个性化药物的领域。随着数据量的增加和计算机性能的不断增长,DL逐渐成为AI子领域中非常重要的组成部分,尤其是其展示的神经网络架构的灵活性,例如卷积神经网络(CNN),递归神经网络(RNN)和完全连接的前馈网络。我们相信,通过与人工智能的结合,我们可以不断提高临床试验的成功率,以及打造更快、成本更低和更有效的药物开发流程。
药物开发过程
反馈驱动的药物开发过程始于从各种来源获得的现有结果,例如高通量化合物和片段筛选,计算模型以及文献中提供的信息。此过程在归纳和演绎之间交替进行。这种归纳—演绎循环最终获得优化的苗头化合物和先导化合物。在此循环中的特定部分的自动化可减少随机性和错误,并提高药物开发的效率。从头设计方法需要有机化学知识来进行合成路线设计和虚拟筛选可以代替品药效和毒性的生化和生物学测试。最终,主动学习算法可以鉴定对特定疾病靶标具有希望活性的新化合物。
药物开发的第一步是识别具有生物活性的新型化合物。该生物活性可以由化合物与特定酶或与整个生物体的相互作用产生。针对给定生物学靶标表现出活性的第一种化合物称为“苗头化合物”。苗头化合物通常来源于对化学库的筛选、计算机模拟或对植物,细菌和真菌等天然产物的筛选。先导化合物的识别是药物开发的第二步。先导化合物是一种化合物,其有望开发为新药来治疗某种疾病。识别出的苗头化合物用处于疾病状态的细胞实验进行筛选,并用疾病动物模型表征其有效性与安全性。一旦发现先导化合物,其化学结构即就用作为结构修饰的起点,以发现具有最大治疗益处和最小潜在危害为目标。
在生成先导化合物的过程中,研究者会对苗头化合物进行系统修饰以提高其对特定生物靶标的活性和选择性,同时降低毒性和副作用。源自苗头化合物相关的化合物称为衍生物,该过程称为苗头化合物扩展(Hit expansion)。药物化学家使用成熟的有机化学技术进行苗头化合物扩展。为了提高合成通量,化学家专注于特定的反应或一组反应,以将结构单元组装在一起以便快速制造一系列衍生物。“砌块”是具有反应性官能团与原子的一类化合物,它能与与生物靶标活性位点相互作用。该活性位点是生物靶标中与化合物(或底物)通过相互作用力结合的特定区域。底物与活性位点的结合可以被可视化为“锁和钥底物匙”或“诱导契合”模型。
药物开发中的研发效率和损耗率
虽然在药物开发中已严格采用完善的类药物性指南,但制药公司在提高研发效率方面仍然面临着巨大挑战。研发效率只是一个术语,用于描述每10亿美元研发支出可获得被FDA批准的新药数量。实际上,发现和开发一种药物的费用已从2001年的8亿美元增加到目前的约30亿美元。而如果将那些完全失败的研发成本也计算进来,那么每一种将要实际使用的新药的平均成本已经高得惊人。我们系统地分析了造成这种令人担忧的统计数据的主要原因,并将其缩小为影响研发效率低下的四个因素:
1、现有疗法进行改进的门槛越来越高( the ‘better than Beatles’ problem)
2、监管机构对风险承受力的逐渐降低( the ‘cautious regulator’ problem)
3、新药研发需要的人员与资金越来越庞大(the ‘throw money at it’ tendency)
4、“基础研究-蛮力”偏见(basic-research–brute-force’ bias)
而另一种理论解释被称为“悬而未决的问题”(‘low-hanging fruit’)。意思是常见的、易于被发现的药物已经被发现,剩下的药物靶标被发现的难度更大,因此研发的成本自然越来越高。
【此处与原文有删减】
AI在新药研发中的应用
寻找成功新药的任务是艰巨,也是药物开发中最困难的部分。这是因为已知的化合物空间过于巨大,据估计约为含有10^60个分子。在新药研发中结合人工智能已经成为一种共识,并已经广泛应用于药物开发的各个阶段,例如药物靶标的识别与验证、药物设计、老药新用、提高研发效率、生物医学信息的汇总与分析、决策优化以及招募患者进行临床试验。人工智能强大的能力为抵消传统药物开发方法中出现的效率低下和不确定性提供了机会,同时将过程中的偏见和人为干预降至最低。
人工智能在药物开发中的其他用途包括预测类药分子的合成路线、药理特性、蛋白特征以及药效、药物组合和药物-靶标关联分析和老药新用 。此外,通过产生新的生物标记和治疗靶标、基于组学标记的个性化医学以及发现药物和疾病之间的联系,这使得利用组学分析识别新的通路和靶标成为可能。
DL在提出有效的候选药物并准确预测其性质和可能的毒性风险方面显示出了巨大的成功。在过去,没有大数据集、没有高通量化合物筛选等技术,需要高达25亿美元的研发成本与超过十年的时间才能研发一种新药。而现在人工智能技术可以快而且低成本解决。随着人工智能技术的进步,新的研究可以在协助新的药物靶标、合理药物设计、药物再利用方面继续创新。
原文链接:https://www.sciencedirect.com/science/article/pii/S1359644618300916?via%3Dihub
下篇预告
AI在寻找分子靶标中的作用
AI在寻找“命中”与“先导”中的作用
AI在合成类药物化合物中的意义
使用AI预测化合物的作用方式
AI在选择人群中进行临床试验
药物再利用中的AI
多元药理学中的AI
制药行业与AI公司之间的合作伙伴关系
结束语