头条
It's not just you:在 AI Overviews 发布后谷歌缩减了其规模
https://www.androidpolice.com/google-ai-overviews-scaled-back-rocky-launch
谷歌已经缩减了AI Overviews功能。人工智能生成的答案目前出现在约 11% 的查询中,低于上个月推出该功能时的约 27%。该公司仍在完善这一功能。尽管该公司在营销中强调该工具可用于购物、餐厅推荐和旅游,但AI Overviews在以健康为重点的搜索中出现得最多。
Cartwheel 为生成式 3D 动画工具筹集 560 万美元种子轮融资
由我们的安德鲁-卡尔(Andrew Carr)创办的运动合成初创公司 Cartwheel 已获得由 Accel 和 KV 领投的种子轮融资。该公司建立了一个文本到动画的工具,并与现有的 3D 工作流程进行了强大的整合。
Mistral推出微调API
https://mistral.ai/news/customization/
Mistral 通过其平台和应用程序接口推出了定制机型。
研究
Google 优化运输路线
https://research.google/blog/heuristics-on-the-high-seas-mathematical-optimization-for-cargo-ships/
谷歌运营研究小组改进了货运路线的数学优化。让燃料使用量和成本降低了 13%。
DreamMat: High-Quality PBR Material Generation
https://zzzyuqing.github.io/dreammat.github.io/
Dream Mat 是一种改进 3D 物体纹理生成的好方法。它使用反照率、金属效果和粗糙度等多种经典图形技术,为三维网格提供极具吸引力的输出效果。
LlamaCare for Medical Applications
https://arxiv.org/abs/2406.02350v1
研究人员推出了用于医学知识的微调大语言模型(LLM)LlamaCare,以及用于解决 LLM 分类问题的扩展分类集成(ECI)。
工程
Explainable Recommender Systems with LLMs
XRec 是一个与模型无关的框架,它利用大型语言模型的语言能力来增强可解释的推荐系统。
神经表面重构
https://github.com/prstrive/gens
GenS 是一种端到端可通用的神经曲面重建模型,它能在没有三维监督的情况下从多视角图像中重建曲面。
Efficient LLMs without Matrix Multiplication
https://github.com/ridgerchu/matmulfreellm
研究人员找到了一种方法,既能消除大型语言模型中的矩阵乘法(MatMul),又能保持强大的性能,即使在十亿参数规模时也是如此。
杂七杂八
Stable Audio Open
https://huggingface.co/stabilityai/stable-audio-open-1.0
Stability AI 发布了 Stable Audio 的权重值,该权重值经过训练,可根据许可的音频样本生成音效。
I'm Bearish OpenAI
https://stovetop.substack.com/p/im-bearish-openai
OpenAI 最近的人才流失和对消费产品的关注使其与大型科技公司竞争的道路变得更加复杂。
基础模型的未来是闭源的
https://blog.johnluttig.com/p/the-future-of-foundation-models-is
由于数据和计算的集中化力量,未来的人工智能基础模型将是闭源的,这有利于经济上可行和安全的封闭模型,而不是开源的替代模型。
BrightEdge 发布谷歌 I/O 大会后关于 AI Overviews数据
BrightEdge Generative Parser 的新发现揭示了受 AI Overviews影响的主要行业、触发结果的因素以及谷歌自动预测和回答搜索查询的位置。
Captions
无需演播室,即可生成演播室级别的视频,包括自定义灯光、不同的摄像机角度和不同的背景。
通过高效压缩生成视频
https://ailab-cvc.github.io/cvvae/index.html
CV-VAE 是一种与现有图像和视频模型兼容的视频 VAE,它提供时空压缩的潜在空间,可使用预先训练好的模型高效地训练新的视频模型。