
英矽智能是一家由生成式人工智能驱动的药物研发公司,通过下一代人工智能系统连接生物学、化学和临床试验分析,聚焦癌症、纤维化、免疫、中枢神经系统疾病、衰老相关疾病等未被满足医疗需求领域,推进并加速创新药物的研发。公司于 2025 年 12 月 30 日正式登陆港交所。
PandaOmics是一个基于云的软件平台,它将人工智能和生物信息学技术应用于多模态组学和生物医学文本数据,用于发现治疗靶点和 biomaker。

1 PandaOmics平台功能概述
1.1 数据集选择和样本组比较创建
1、该平台利用动态组学数据(包括基因表达、蛋白质组学和甲基化数据),系统地搜索相关数据集
2、PandaOmics 使用的数据库列表如截图所示
3、PandaOmics 数据处理流程:(1)数据集选择;(2)样本比较;(3)基因和通路水平分析;(4)分子特征和临床数据相关性探索,将这些步骤的结果整合到 meta-analyses 中;(5)利用文本数据中提取的先验知识在内的多种数据源来增强靶点预测;(6)治疗靶点和 biomaker 确认;(7)支持识别与疾病相关的化合物;(8)适应症优先排序,拥有一个预计算疾病荟萃分析的数据库;(9)生物知识图谱;(10)大语言模型 chatPandaGPT 来解释基因-疾病的关联;(11)用于靶点验证和化合物筛选的机器人实验;(12)进行小分子生成的平台 Chemistry42


1.2 差异表达基因、扰动通路和元数据分析
1、PandaOmics 还提供基因和通路水平的数据分析。它利用 iPANDA 算法识别具有生物学意义的通路,该算法可进行通路激活分析
2、PandaOmics 能够将多个与疾病相关的比较数据聚合到荟萃分析中。荟萃分析能够从各种数据集中提取一致且可靠的见解,并整合与疾病相关的遗传数据,包括全基因组关联研究 (GWAS) 和驱动病理的体细胞突变信息。来自出版物、基金申请和临床试验的文本数据可作为荟萃分析中组学数据的补充
1.3 治疗靶点识别
1、PandaOmics平台的荟萃分析页面提供了一个全面的靶点识别(ID)界面,以用户友好的仪表盘形式呈现,其中包含基因排名列表(这个模块与OpenTarget比较类似)
2、基于组学的模型可分为两大类:生物信息学方法和先进的机器学习及图论技术。第一类方法的一个例子是表达评分,它依赖于疾病样本与配对的正常对照样本之间的差异表达,并结合疾病相关组织中的表达水平。这种方法能够直接评估基因的重要性。相比之下,第二类方法则更为复杂,例如异构图游走算法。该算法在异构图上采用基于引导随机游走的方法,其中节点代表基因和疾病,边代表它们之间的关联。模型学习节点的表示,并随后识别与参考疾病节点密切相关的基因节点,从而发现潜在的靶基因(这里有点像网络图分析)
1.4 适应症优先排序
1、PandaOmics平台提供适应症优先级排序和扩展功能,增强了其在靶点发现和治疗药物开发中的实用性。该功能使研究人员能够将研究范围扩展到单一疾病之外,探索候选靶点的潜在跨适应症适用性
2、PandaOmics 的预计算疾病荟萃分析库进一步简化了整个适应症优先级排序/扩展流程
1.5 化合物鉴定
1、与基因排序类似,化合物ID模块利用化合物的基因表达谱并整合文本数据来评估其重要性。通过分析化合物的基因表达特征并将其与已知的治疗靶点或疾病相关基因进行比较,PandaOmics 为化合物分配分数,从而实现对其优先级的确定
1.6 生物知识图谱
1、PandaOmics 不仅协助研究人员进行靶点和生物标志物选择,还能提供全面的证据来支持每个假设。该平台整合了组学数据(例如基因-疾病关联)和从科学文献中提取的见解,并通过强大的生物知识图谱进行整合。该知识图谱采用先进的实体识别和关系提取算法构建,包含基因、疾病、生物过程和化合物等信息。此外,该平台还整合了来自临床试验数据的宝贵见解,从而帮助用户更深入地了解竞争格局(后续需要关注一下知识图谱这项技术)
1.7 与机器人平台集成
1、包括细胞培养、化合物筛选和细胞敲除/敲低模型、新一代测序和细胞成像在内的机器人平台与 PandaOmics 治疗靶点发现平台形成强大的协同效应,从而能够快速、精准地发现新的靶点和生物标志物。通过将机器人系统集成到研究流程中,靶点和化合物验证等任务可以以标准化的方式执行,显著减少人为误差并提高通量
2 验证
1、验证指标包括富集倍数变化的对数(ELFC)和基于超几何p值的富集统计显著性(HGPV),分别用于衡量PandaOmics预测模型的性能。ELFC 指的是富集倍数变化的对数转换值,它显示了已知靶点在列表顶部的富集程度;而 HGPV 则代表效应的统计显著性,它显示了从随机基因列表中达到相同富集水平的可能性。ELFC 和 HGPV 值越高,则排序方法的预测能力越强
2、该平台并非灵丹妙药,无法产生单一的理想假设,而是提供了一系列具有强有力证据的假设,使研究人员能够选择最有希望的靶点,以便在药物开发项目中进行进一步研究。通过PandaOmics获得的结果质量在肿瘤学、炎症和免疫学、心血管代谢疾病、纤维化以及其他具有明确内部分子机制的疾病领域等主要治疗领域同样可靠

主要关注的技术:荟萃分析、知识图谱、通路分析
通路分析文章和代码如下:
https://www.nature.com/articles/ncomms13427
https://github.com/varnivey/ipanda