Chronos:将语言模型架构适配时间序列预测
通过将时间序列数据标记化并视作语言处理,某中心研究人员成功将大语言模型架构应用于时间序列预测任务。实验表明,该模型的零样本性能匹配或超越了专为时间序列预测设计的模型。
高性能“25519”椭圆曲线密码学
椭圆曲线密码学作为一种公钥加密方法,较依赖大数分解的方法具有优势。某中心云服务研究人员针对其硬件优化了25519椭圆曲线密码学的汇编级实现,并采用自动化推理验证功能正确性。该实现已纳入开源密码库某机构LibCrypto。
大语言模型是否理解世界?
仅通过预测词序列下一词训练的语言模型能否表征词义?某中心科学家指出,这类模型不仅能够而且确实实现了语义理解。从多感官领域到书面语言的转换可视为简单投影,类似于三维场景向二维图像的投影。
新工具与数据集助力大语言模型幻觉检测
RefChecker是一种检测大语言模型幻觉的方法,它将模型输出分解为具有<主体、谓词、客体>结构的知识三元组,相比早期使用提取句子或短语作为主张摘要的方法,能更精细评估事实准确性。该方法还包含基准数据集,涵盖零上下文、噪声上下文和准确上下文三种设置下各100个文本生成任务示例。
构建常识知识图谱提升商品推荐
为匹配用户查询与某中心商店中最相关商品,常需常识推理(例如推断“防滑鞋”可能与“孕妇鞋”查询相关)。为支持此类推理,研究人员利用大语言模型从用户交互数据提取常识关系,并将其编码为可查询的巨型图谱。
通过试题生成自动评估RAG管道
针对检索增强生成(RAG)模型的幻觉问题,某中心研究人员开发了一种评估方法:使用大语言模型为知识库中与特定任务相关的每篇文档生成多选题测试,再根据模型在测试中的表现进行评分。
某中心生成式AI购物助手的技术内核
某中心基础AI组织副总裁兼杰出科学家介绍其团队开发的生成式AI购物助手。该助手通过回答亚马逊购物应用中的各类问题(从产品细节、比较到推荐),帮助用户做出更明智的购物决策。
虚拟全能试穿:任意场景中的产品可视化
与早期仅生成穿衣人像的虚拟试穿模型不同,某中心“虚拟全能试穿”模型允许用户将任意产品无缝插入任意场景的任意位置。用户提供个人场景图像和产品后,通过绘制遮罩指定插入位置,模型会以真实的角度、光照和阴影将物品融入场景。该模型成功的关键在于辅助U-Net编码器,其基于粗略复制粘贴拼贴生成“提示信号”,其中产品图像会按背景场景比例调整后插入遮罩。
AI在某中心药房的处方全流程应用
从将原始处方数据转录为标准格式的大语言模型,到生成准确价格估计的决策树模型,再到帮助用户应对药房行业复杂性的某中心药房助手,AI正提升用户与药房交互的每个环节。