从多种生物标志物到以患者为中心的个性化医疗:一个用于决策支持的“应用语义知识库”
总结
来自多种模式(组学、成像、临床终点)的生物标志物的使用——尽管在科学界有所增加——在很大程度上落后于将其用于患者筛查作为治疗方案决策支持的承诺。这部分是因为异构实验数据和公共数据的语义整合困难,以及理解相关生物功能的复杂性,这两者对于预测生物学在临床上开发更安全的药物和更有效的治疗至关重要。
基于核心数据访问和集成能力,感知软件应用语义模式,使用内部实验数据和/或外部发布信息的几乎任何组合来创建、完善和鉴定生物标志物网络模型。这种模式应用扩展语义“可视化SPARQL”查询技术来跨多个信息集构建复杂的搜索,即使初始数据集没有在任何公共数据库模式或联合方法下正式连接。特定研究重点特有的应用语义知识库(ASK)包含这些模式的阵列,从而提供了适用于筛选和决策的集合。
在本海报中,我们展示了3个最近使用ASK的客户示例,以展示其作为决策支持工具的能力:
前列腺癌组合疗法的治疗效果评估;
心、肺或肾衰竭风险患者的症状前检测、评分和分层
炎症反应对高危斑块破裂的影响
实验关联网络的语义连接丰富了策划的公共领域知识网络,有助于研究人员在功能水平上更好地理解生物标志物的机械方面。然后将这些知识应用于高度敏感、特定、评分的患者筛查——为生命科学和个性化医疗提供自信的决策支持。
挑战
数据一致性:来源、分类、本体和非标准化词汇。
多组数据集有意义集成的复杂性。
缺乏直观、科学驱动的假设和直观决策支持工具。
生物标志物分类器验证需要机械和功能方面的见解。
统一公共资源和内部数据集以及适当的标记权重并非易事。
方法论
整合多种模式的数据集,为所有数据提供统一的接入点。
将结果合并并映射到语义框架中,以可视化、调查和分析数据关系。
使用数值属性缩放潜在标记,以降低网络复杂性并预选分类器。
通过查询在独立分析结果之间具有稳健相关性的多种模式中识别统计显著变化。
通过结合机械公共知识验证实验网络的生物可行性
将生成的子网络保存为SPARQL查询,并将模型表示为此类查询的数组。
用测试用例细化每个模型;将其应用于未知因素进行筛选,并使用匹配评分(“匹配命中率”),以高置信度进行知情决策。
方法
结合基于web的联合查询和语义网络方法创建统一的知识库。
创建一种简单的方法来探索生物数据的知识网络,识别潜在的标记,并建立精细化假设,将复杂的生物功能描述为生物系统子网。
这些假设可以导出到一个轻量级的基于web的应用程序,该应用程序允许从任何位置访问以进行筛选和决策支持。
科学家有能力将假设应用于现有数据集,并在生成新信息时将其扩展到新信息,从而不断完善模式。
结果和讨论
这张海报展示了一种创新的方法,用于整合实验和公共数据源,视觉探索这种整合环境,并构建特征生物标记模式。
数据的语义集成和合并确保了一致性,协调了同义词和不同术语,并为相关网络分析提供了一致的基础。
SPARQL查询被可视化地捕获并保存在代表特定生物功能的数组中。能够以简单、自动化的方式创建复杂模型,使该方法具有普遍适用性。
ASK已积极应用于器官衰竭的预测性症状前患者筛查(证据2)、高危斑块破裂前斑块阶段的识别(BG医学HRP3)以及前列腺癌癌症治疗的比较有效性(PCC4)的决策支持。
影响与未来
应用语义知识库(ASK™) 为面临复杂生物学问题并每天依赖决策支持的生命科学和临床研究人员提供一种新颖、直接适用的方法来满足他们的需求。
虽然这项技术已经应用于制药研究、生命科学和个性化医学的多个领域,但其作为知识应用提供决策支持的功能范围从目标到化合物,再到患者治疗和筛选。
使用综合临床、基因组学、蛋白质组学、代谢和分子表型数据以及通过基于网络的工具从公共知识网络获得的机械见解,对疾病状态和治疗进行可操作的推断,是以患者为中心的个性化医疗的一个显著步骤。
图1:实验相关性网络和知识网络的语义数据合并:从电子表格和数据库查询(1,2左)到本体合并(3)和参考增强生物标记网络(4,右)
图2:从图中创建SPARQL:主网络中的节点选择(1)自动生成查询(2)和实际SPARQL语句(3)的可视化SPARQL表示
图3:网络浏览器可访问的ASK数组:作为症状前心脏移植失败决策支持的预测性筛选(左:评分界面)和预测置信度的“命中匹配”表示(右)
结论
以易于使用的方式应用一系列基于语义的模型是其对生命科学和个性化医学研究人员的吸引力所在,他们面临着复杂的生物学问题,每天都依赖于自信的决策支持。
能够通过直观的网络工具使用、共享和应用基于复杂网络模型的知识,该工具对用户隐藏了潜在的复杂性,同时还提供了关于哪些数据(目标、化合物、疾病、患者)适合模型以及在每个特定情况下匹配情况如何的简明信息,正在改变知识在生命科学和个性化医学中构建、提炼和应用的方式。