2025-01-13 简讯 : 独立应用Grok在美国iOS系统上发布


头条


独立应用Grok在美国iOS系统上发布

https://www.tomsguide.com/ai/xais-standalone-grok-ios-app-launches-in-the-us-heres-how-to-find-it

xAI的独立应用Grok现已在美国iOS系统上架。它具备先进的对话式人工智能功能。

Meta的Llama模型受版权保护的训练

https://techcrunch.com/2025/01/09/mark-zuckerberg-gave-metas-llama-team-the-ok-to-train-on-copyrighted-works-filing-claims/

最近一份文件称,Meta的Llama团队经马克·扎克伯格批准,使用受版权保护的材料进行训练,这引发了人们对人工智能训练中知识产权使用问题的担忧。

谷歌Lens 小贴士

https://blog.google/products/search/google-lens-tips-2025/

谷歌重点介绍了2025年谷歌Lens 的新技巧和功能,展示了其在视觉搜索方面的扩展能力以及与日常任务的整合。


研究


透明视频生成

https://wileewang.github.io/TransPixar/

透明生成算法包含 alpha 通道,这提高了该模型在视觉特效应用中的实用性。

3D鸟类生成

https://kamwoh.github.io/chirpy3d/

这种算法能利用部件和习得的组合算法生成新奇的鸟类。由于底层生成网格的质量不错,结果令人惊艳且很有用。

用多模态模型实现图形用户界面自动化

https://arxiv.org/abs/2501.04575v1

InfiGUIAgent是一款GUI自动化工具,它利用多模态大语言模型和两阶段训练过程来增强推理和交互能力。


工程


神经SVG生成

https://sagipolaczek.github.io/NeuralSVG/

很多作品旨在生成SVG图像。这个作品特意按顺序生成物体的各个部分,这样生成的图像干净、可编辑且简洁。其输出效果也相当不错。

DiffSensei:连接多模态大语言模型(LLMs)与扩散模型以实现定制漫画生成(GitHub仓库)

https://github.com/jianzongwu/DiffSensei

用于漫画故事创作的可控、连贯的角色和对话框生成。它的运作方式几乎就像一个确保角色一致性的Control Net。

一种新的适配方法(GitHub 仓库)

https://github.com/cfuchs2023/oga

OGA是一种在线适配方法,它能在数据流中建立一个零样本熵较低的样本缓存。


其他


增长营销中的人工智能与量化实验

https://every.to/thesis/the-new-science-of-growth-marketing

人工智能正迅速改变营销行业。本文介绍当下有效的增长营销战略,包括助力网站自我提升的智能体以及大规模的个性化内容。这些战略被称作 “量化实验”,这一说法借鉴了量化交易。量化交易在20世纪80年代给金融界带来变革,而如今增长营销领域的转变与之有相似之处 。

不,大语言模型(LLMs)不会“耍心机”

https://www.strangeloopcanon.com/p/no-llms-are-not-scheming

2024年,我们借助OpenAI的o1等人工智能轻松超越了图灵测试。人工智能展现出令人赞叹的对话能力,但缺乏类似人类的情境意识——关于大语言模型(LLMs)只是模式学习者还是具备推理能力的实体,存在诸多争论。这些模型在复制方面表现出色,但由于缺乏上下文理解,难以对模式进行优先级排序。重点应继续放在完善模型训练和评估方法上,而不是赋予人工智能系统类似人类的特征或意图。

刚刚发生了什么

https://www.oneusefulthing.org/p/what-just-happened

人工智能进展加快,出现了几款新的GPT-4级别和Gen3模型,带来了革命性和渐进式的改进。o1模型展现出先进的推理能力,能找出学术论文中的错误,还能辅助研究,凸显出人工智能在传统任务之外的作用不断扩大。如今人工智能的能力包括实时视频交互以及更出色的文本到视频生成,这预示着未来意义深远,跨领域整合的机会众多 。


快讯


字节跳动(Hugging Face Hub)的Sa2Va模型

https://huggingface.co/collections/ByteDance/sa2va-model-zoo-677e3084d71b5f108d00e093

字节跳动发布了三种尺寸的新模型,该模型将强大的视觉语言模型(VLM)性能与SAM2中的开放词汇分割功能相结合。

极其简单的技巧就能破解哪怕最先进的人工智能聊天机器人

https://futurism.com/the-byte/easy-hack-jailbreak-ai-chatbot

Anthropic的一项新研究发现,通过改变大小写或拼写,大语言模型(LLMs)很容易被“越狱”。

字节跳动似乎在规避美国限制购买英伟达芯片。

https://techcrunch.com/2024/12/30/bytedance-appears-to-be-skirting-u-s-restrictions-to-buy-nvidia-chips-report/

字节跳动计划2025年斥资70亿美元购买英伟达芯片,将芯片存储在中国境外以规避美国限制。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容