头条
Meta AI 应用程序
Meta推出了一款新的独立AI应用程序,加大了将AI功能更直接融入消费者体验的力度。
META 的 Llama API
https://techcrunch.com/2025/04/29/meta-previews-an-api-for-its-llama-ai-models/
Meta在LlamaCon上展示了其Llama API的有限预览版,为开发者提供了用于微调、部署和评估Llama系列模型的工具。
研究
语言等变性:理解人工智能“含义”的一种方法
https://links.tldrnewsletter.com/EbNlwY
一名研究人员发现了大语言模型(LLMs)中的句法-语义问题,并提出语言等变性来解决这些问题。该方法建议检查大语言模型的道德判断在翻译后是否保持一致。语言等变的大语言模型可能代表着超越单纯句法的更深入理解。
用于企业数据的关系图Transformer
https://kumo.ai/research/relational-graph-transformers/
关系图Transformer可以帮助应对企业数据难题,并为客户分析、推荐、欺诈检测和预测等应用提供支持。
人工智能伙伴
https://avatars.substack.com/p/10-ai-companions-pt1
人工智能伙伴即将重新定义数字格局。它们不再只是简单的聊天机器人,而是演变成能提供真正个性化服务、增强用户参与度的互动界面。目前通用的人工智能交互方式不利于建立有意义的联系。未来要取得成功,关键在于直观的设计,让人工智能更像个人伙伴,而不是工具。随着人工智能的成熟,重点应从模型质量转向提升用户体验和个性化服务,让人工智能成为能激发好奇心和自我探索的真正伙伴。
工程
CogView 4图像生成模型(Hugging Face平台)
https://huggingface.co/THUDM/CogView4-6B
CogView 4是一款获得宽松许可的下一代生成式图像模型。在多个关键指标上,它的表现优于Flux模型。
人工智能对冲基金(GitHub 代码库)
https://github.com/virattt/ai-hedge-fund
人们多次尝试用现代推理模型实现交易自动化。这次的尝试比其他的稍好一些,不过仍需付出大量努力。它利用基于角色的提示来汇总对各类基础资产的预测。
无别名超分辨率(GitHub 仓库)
https://github.com/prs-eth/thera
这项新成果能提升到任意分辨率,且不会出现常见的重建混叠问题。
其他
《2025年度职场趋势指数:前沿公司诞生》
微软《2025年工作趋势指数》报告强调,工作正朝着由人工智能驱动的“前沿企业”转变,着重即时可用的智能、人机协作团队,以及“智能代理老板”的兴起。微软还宣布对Microsoft 365 Copilot进行更新,以加强人工智能在办公应用程序中的整合。
GPT-4.5背后的OpenAI研究员美国绿卡申请被拒
一位对GPT-4.5有贡献的OpenAI关键研究员,其美国绿卡申请被拒。这一决定引发了对顶尖人工智能人才移民障碍的担忧。
开发者越发重视生成式人工智能专业技能
http://hackread.com/why-developers-care-about-generative-ai-experts/
开发者若想实现职业发展并获得竞争优势,应优先掌握生成式AI技能。各公司都在寻找专家,以引领各项目中由AI驱动的创新。
NoteBookLM音频综述扩展至50多种语言
https://blog.google/technology/google-labs/notebooklm-audio-overviews-50-languages/
谷歌增强了NotebookLM,在50多种语言中启用其广受欢迎的音频概述功能,让全球更多人能获取人工智能生成的播客式摘要。
OpenAI希望其“开放”人工智能模型能向云端模型求助
OpenAI计划发布一款免费开源模型,该模型能将任务交给其云模型以提升性能。
使用ElevenLabs技术的人工智能电台主持人在澳大利亚亮相
https://www.independent.co.uk/tech/ai-radio-host-australia-cada-elevenlabs-b2739399.html
主持人与听众互动,并在直播中播报新闻片段。