Gene Tracer: a smart, interactive, voice-controlled Alexa skill For gene information retrieval and browsing,mutation annotation and network visualization
文章链接: https://doi.org/10.1093/bioinformatics/btab107
文章主要介绍了一种基于亚马逊人工智能技术的基因查询手段Gene Tracer。Gene Tracer以自然语言处理算法与语音识别技术为主干,利用获取的信息在NCBI、FunSeq2中进行检索,展示基因信息、突变效应、蛋白互作网络等相关信息,其呈现方式为可视化浏览器。
文章指出,机器学习、深度学习、自然语言处理算法等技术的发展,拓宽了计算机算法的使用范围,革新了新技术的使用方法,使得语音控制能够广范应用于生活的多种场景。作者认为,在生物学研究领域,研究人员与设备的互动不应局限于鼠标、键盘等,语音查询亟待发展,解放研究人员双手。
Gene Tracer由基因信息检索、基因组可视化、有害突变可视化、互作网络可视化以及历史查询等部分组成。
(1)基因信息检索。研究人员可以提供确切的基因名称或模糊的查询词,如与某种疾病相关或其他功能属性。服务器将根据NCBI的基因摘要输出相关基因并显示在屏幕上。
(2)相关区域的基因组可视化。展示内容包括以相关基因为中心的基因组片段,包括组蛋白标记信号、TF结合信号等相关信息,同时,可以搜索基因的周围区域。
(3)最有害突变可视化。研究人员可以通过突变视图进行浏览,发现具有高度有害影响的突变。同时,Gene Tracer可以从ClinVAR查询编码和非编码突变。
(4)互作网络可视化。Gene Tracer可以展示蛋白互作网络视图。数据来源于网络服务器端的蛋白质-蛋白质交互数据集。
老师曾在GeneBackbone群里分享过这篇文章。文章中,Gene Tracer使用的方法是利用Amazon Alexa的语音处理与识别,将声控信息经过提取,获取基因特性的关键词,在NCBI官网中对基因的描述(gene‘s summary版块)进行模糊检索,筛选出可能符合声音输入的结果,属于将前沿技术利用到生物领域的初步尝试。作者举例使用的是人类基因组中乳腺癌相关的基因,由于人类基因组研究较为成熟,基因功能注释较为完善,语音检索结果准确度与可信度均较高;若将此方法应用于植物时,会因为植物基因功能注释十分有限,造成检索不全、检索错误等情况,不利于研究进展。