29

新研究开发了名为「Patch-to-Cluster attention」(PaCa)的新视觉Transformer(ViT)方法,可以改善ViT在图像识别、分类和分割对象的能力,降低计算需求,提高模型可解释性。PaCa方法使用聚类技术,使ViT更好地识别并关注图像中的对象,从而解决了计算和内存需求方面的挑战。聚类方法将图像中的部分数据汇聚到一起,从而大大减少了系统的计算需求。优化可解释性上,该方法创建的聚类数量较少,因此可以更容易地查看这些聚类特征,理解AI的数据处理逻辑下一步,研究人员计划将PaCa用在更大的数据集上进行训练测试效果。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Cancer Cell | AI集成肿瘤多模态数据:数据融合和关联发现 原创huacishu图灵基因2022-10...
    图灵基因阅读 3,130评论 0 1
  • 人工神经网络,是当下实现人工智能最主要的技术研究方向之一,我们所看到的AI落地产品,大部分都使用了人工神经网络的技...
    深度人工智能阅读 3,682评论 0 0
  • 人工智能正在成为检验公司未来潜力的试金石。这项技术对任何投身其中的公司来说都是有希望取得丰硕成果的。现在,很多公司...
    不加班的程序员阅读 1,225评论 0 0
  • Nature | AI病理预测未知原发性癌症的起源 原创榴莲不酥图灵基因今天 收录于话题#前沿生物大数据分析 撰文...
    图灵基因阅读 1,729评论 0 0
  • 正则化的目的是稀疏神经网络中的权值,通过一些限制条件,训练使其中的一些不重要的权重为0,从而达到稀疏的目标,并且可...
    晨曦日月阅读 8,235评论 0 1

友情链接更多精彩内容