机器学习(ML)算法在神经科学领域的应用显著增加。但是,算法多种多样,哪一种是预测目标变量的最优模型?这种模型的超参数是什么?鉴于这些问题的可能答案过多,在过去几年中,自动化ML (autoML)得到了越来越多的关注。
英国伦敦大学国王学院的科学家们应用一个名为“基于树的管道优化工具”(TPOT)的自动库,它使用ML管道的基于树的表示,并采用基于遗传编程的方法来查找模型及其超参数,以便更准确地预测主题的真实年龄。
为了探索算法并评估其在神经成像数据集中的有效性,科学家们选择了一个以前广泛研究的焦点问题:脑年龄预测。在没有任何先验知识的情况下,TPOT能够在模型空间中进行扫描,并创建出仅使用解剖结构的厚度和体积信息就能超过基于之前现有模型的最先进精度的管道。
科学家们比较了TPOT(平均绝对误差: 4.612±.124年)和相关向量回归(MAE 5.474±.140年)的性能。TPOT还提出了一些有趣的模型组合,这些模型与当前最常用的大脑预测模型并不匹配,但可以很好地推广到未见数据。AutoML作为一种数据驱动的方法,为神经成像应用寻找最佳模型,显示出了有希望的结果。
参考文献:
Dafflon J, Pinaya WHL, Turkheimer F, Cole JH, Leech R, Harris MA, Cox SR, Whalley HC, McIntosh AM, Hellyer PJ.Hum Brain Mapp. 2020 May 16. doi: 10.1002/hbm.25028. [Epub ahead of print] An automated machine learning approach to predict brain age from cortical anatomical measures.