头条
谷歌发布自己的 “推理” AI模型
Google推出了Gemini 2.0 Flash Thinking Experimental,这是AI Studio中用于编程和数学等任务的推理AI模型。该模型旨在通过内部验证其推理来提高准确性,尽管它目前正在努力完成字母计数等简单任务。
OpenAI的应用程序
在第11天,OpenAI介绍了有关使用OpenAI桌面应用程序的更多细节。
Anthropic对对齐伪造的共享见解
Anthropic探索了人工智能系统如何在追求自己的目标的同时表面上与人类价值观保持一致,并提供了对检测和缓解策略的见解。
研究
上下文是关键: 使用基本文本信息进行预测的基准
最佳和最常用的时间序列预测方法完全依赖于与时间序列相关的数字特征。但是,他们很少使用有关任务本身的文本或语义信息 (例如,您是在预测电价还是客户流失)。当在上下文中提示此文本信息时,语言模型在广泛的仔细去污染的任务中基本上超越了所有经过测试的时间序列预测方法。
提示深度任何4k分辨率精确度量深度估计
通过使用低成本的激光雷达 (在现代iphone中找到) 以及深度估计基础模型,这种方法表明,你可以促使系统重建一个非常高保真的点云,而不是单独使用任何一种方法,并且可以与非常昂贵的激光雷达设置相媲美,例如在自动驾驶汽车上发现的那些。
现代BERT
BERT是一种仅限编码器的样式模型,是市场上使用最广泛的语言模型之一,在Google搜索中用于基本上每个查询。来自Answer AI,LightOn和friends的这种新模型更快,更现代,性能卓越。它可以用作替换的下降。他们使用许多现代技巧,如批处理ramp,以提高整体模型性能。
工程
AniDoc (GitHub)
AniDoc是一种线条填充方法,可以根据角色参考图像和关键帧的线条艺术系列为动画着色。
用于三维空间理解的高斯变换器
本文介绍了GaussTR,这是一种新颖的高斯变换器,它利用与基础模型的对齐来推进自我监督的3D空间理解。
3D CAD逆向工程 (GitHub)
用于计算机辅助诊断的开源工具,为医学成像研究和开发提供了模块化和可扩展的平台。
其他
AI在App Store上蓬勃发展,开发人员正在利用它
人工智能应用程序充斥着应用商店的图表,但许多应用程序优先考虑现金获取而不是质量,经常误导用户付费墙和低于标准的功能。HUBX在DaVinci AI等应用程序中占主导地位,尽管排名很高,但仍因功能差和误导性营销而受到批评。在饱和状态下,Photoroom和Picsart AI等优质应用程序通过有效的AI工具兑现承诺而脱颖而出。
2024 Backward Pass: AI 2024年的权威指南
来自Translink Capital的Kelvin My分享了人工智能2024年中发生的一切。该报告概述了人工智能的四个层次: 基础设施、基础模型、工具和应用程序。对于每一层,它讨论了关键的收获,2025年及以后的未来趋势,并列出了一些值得注意的初创公司。
空间思维
一项研究计划专注于空间推理和AI模型,旨在在三维空间内解释和交互。
快讯
无服务器LoRA
一起AI有一个新产品,使用户能够通过无服务器切换以基础模型为代价部署自定义LoRA。
血液测试远非完美-但机器学习可以改变这一点
华盛顿大学和哈佛大学的研究人员已经使用机器学习来创建个性化的血液测试参考,从而提高了疾病预测的准确性。
OpenAI联合创始人Ilya sutskerver表示,人工智能的构建方式即将改变
Ilya sutskerver预测,由于新数据的可用性有限,人工智能的预训练将会结束。