头条
独立应用Grok在美国iOS系统上发布
https://www.tomsguide.com/ai/xais-standalone-grok-ios-app-launches-in-the-us-heres-how-to-find-it
xAI的独立应用Grok现已在美国iOS系统上架。它具备先进的对话式人工智能功能。
Meta的Llama模型受版权保护的训练
最近一份文件称,Meta的Llama团队经马克·扎克伯格批准,使用受版权保护的材料进行训练,这引发了人们对人工智能训练中知识产权使用问题的担忧。
谷歌Lens 小贴士
https://blog.google/products/search/google-lens-tips-2025/
谷歌重点介绍了2025年谷歌Lens 的新技巧和功能,展示了其在视觉搜索方面的扩展能力以及与日常任务的整合。
研究
透明视频生成
https://wileewang.github.io/TransPixar/
透明生成算法包含 alpha 通道,这提高了该模型在视觉特效应用中的实用性。
3D鸟类生成
https://kamwoh.github.io/chirpy3d/
这种算法能利用部件和习得的组合算法生成新奇的鸟类。由于底层生成网格的质量不错,结果令人惊艳且很有用。
用多模态模型实现图形用户界面自动化
https://arxiv.org/abs/2501.04575v1
InfiGUIAgent是一款GUI自动化工具,它利用多模态大语言模型和两阶段训练过程来增强推理和交互能力。
工程
神经SVG生成
https://sagipolaczek.github.io/NeuralSVG/
很多作品旨在生成SVG图像。这个作品特意按顺序生成物体的各个部分,这样生成的图像干净、可编辑且简洁。其输出效果也相当不错。
DiffSensei:连接多模态大语言模型(LLMs)与扩散模型以实现定制漫画生成(GitHub仓库)
https://github.com/jianzongwu/DiffSensei
用于漫画故事创作的可控、连贯的角色和对话框生成。它的运作方式几乎就像一个确保角色一致性的Control Net。
一种新的适配方法(GitHub 仓库)
https://github.com/cfuchs2023/oga
OGA是一种在线适配方法,它能在数据流中建立一个零样本熵较低的样本缓存。
其他
增长营销中的人工智能与量化实验
https://every.to/thesis/the-new-science-of-growth-marketing
人工智能正迅速改变营销行业。本文介绍当下有效的增长营销战略,包括助力网站自我提升的智能体以及大规模的个性化内容。这些战略被称作 “量化实验”,这一说法借鉴了量化交易。量化交易在20世纪80年代给金融界带来变革,而如今增长营销领域的转变与之有相似之处 。
不,大语言模型(LLMs)不会“耍心机”
https://www.strangeloopcanon.com/p/no-llms-are-not-scheming
2024年,我们借助OpenAI的o1等人工智能轻松超越了图灵测试。人工智能展现出令人赞叹的对话能力,但缺乏类似人类的情境意识——关于大语言模型(LLMs)只是模式学习者还是具备推理能力的实体,存在诸多争论。这些模型在复制方面表现出色,但由于缺乏上下文理解,难以对模式进行优先级排序。重点应继续放在完善模型训练和评估方法上,而不是赋予人工智能系统类似人类的特征或意图。
刚刚发生了什么
https://www.oneusefulthing.org/p/what-just-happened
人工智能进展加快,出现了几款新的GPT-4级别和Gen3模型,带来了革命性和渐进式的改进。o1模型展现出先进的推理能力,能找出学术论文中的错误,还能辅助研究,凸显出人工智能在传统任务之外的作用不断扩大。如今人工智能的能力包括实时视频交互以及更出色的文本到视频生成,这预示着未来意义深远,跨领域整合的机会众多 。
快讯
字节跳动(Hugging Face Hub)的Sa2Va模型
https://huggingface.co/collections/ByteDance/sa2va-model-zoo-677e3084d71b5f108d00e093
字节跳动发布了三种尺寸的新模型,该模型将强大的视觉语言模型(VLM)性能与SAM2中的开放词汇分割功能相结合。
极其简单的技巧就能破解哪怕最先进的人工智能聊天机器人
https://futurism.com/the-byte/easy-hack-jailbreak-ai-chatbot
Anthropic的一项新研究发现,通过改变大小写或拼写,大语言模型(LLMs)很容易被“越狱”。
字节跳动似乎在规避美国限制购买英伟达芯片。
字节跳动计划2025年斥资70亿美元购买英伟达芯片,将芯片存储在中国境外以规避美国限制。