在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在AI时代中把握机遇。
一、AI 程序员:让人类程序员成为超级个体
阿里云最近推出了一款名为"AI程序员"的创新工具,这是一款能够根据需求自主编写代码的人工智能程序。与传统的代码辅助工具不同,AI程序员能够理解任务需求,从编写代码到Debug全流程,实现真正的自动化软件开发。在多轮交互中,如果需求发生变化,AI程序员也能迅速响应并修改代码。
AI程序员的开发基于通义大模型,由多个智能体组成,每个智能体负责软件开发流程中的不同任务,如需求理解、任务拆解、代码编写、测试等。这种多智能体协同的方式不仅提升了开发效率,还通过智能体间的互相博弈优化了工作目标的实现。
阿里云的AI程序员在SWE-bench上的编程能力表现出色,问题解决率已超过30%,预计不久将突破50%。这一进展预示着AI程序员在简单和重复的编码场景中将具有很高的实用性。产品架构由三层组成:多智能体协同的产品和工程框架、编码场景的数据训练、以及通义大模型。随着技术的进步,预计几个月内将推出邀测版本。
AI程序员的推出旨在"让人类程序员成为超级个体",通过AI辅助提高开发效率,使开发者能够专注于更有价值的创造性工作。阿里云的技术专家对AI程序员的未来发展持乐观态度,并认为半年内将出现真正可用的产品。同时,AI编程助手通义灵码已在实际中显著提升了代码生成效率,显示出AI在软件开发领域的潜力。
这一突破性工具的推出,不仅展示了阿里云在AI领域的技术实力,也为软件开发行业带来了革命性的改变,预示着AI在提高编程效率和创新能力方面的巨大潜力。
二、快手可灵大模型:AI视频创作的新纪元
快手的可灵大模型以其创新的图生视频功能和视频续写能力,为用户带来了AI视频创作的全新体验。用户可以将静态图像转化为动态视频,并通过文本提示词控制物体的运动轨迹,实现个性化创作。视频续写功能支持最长3分钟的视频生成,利用物理世界理解能力,生成符合物理规律的连续运动效果。用户可以轻松地续写视频,实现长达3分钟的连续长视频创作。
可灵大模型的转换和场景过渡功能,让用户在创作过程中可以更加灵活地表达创意和想法。通过添加不同的提示词,实现场景的自然过渡和转换,打造出丰富多彩的视频作品。这一AI技术的突破,不仅简化了视频创作流程,更激发了用户的创意潜力,引领AI视频创作进入一个全新的时代。
三、华为鸿蒙NEXT系统深度融合AI能力,开启智能交互新纪元
华为在2024年开发者大会上发布的鸿蒙原生智能Harmony Intelligence,标志着操作系统领域的重要突破。新版本系统将AI能力融入核心,带来了AIGC图像生成功能,用户可以轻松进行手绘线稿、填色、涂鸦和照片扩图,享受全新的创作体验。此外,业界首创的AI声音修复功能,为言语障碍人群提供了重要的交流辅助工具。
鸿蒙NEXT系统还特别关注视障用户的需求,内置“小艺看世界”功能,通过智能识别周围环境信息,如冰箱内的食物种类和新鲜程度,实现“把世界读给你听”的无障碍体验。
最引人注目的是,Harmony Intelligence的“控件AI化”特性,为第三方App开发提供了无限可能。App开发者可以调用系统空间,实现实时朗读、智能填充、图文翻译、主体抠图等高级功能,为用户提供更加智能、便捷的使用体验。
总体来看,华为鸿蒙NEXT系统深度融合AI技术,在图像和声音处理、无障碍体验、第三方App开发等方面实现了重大创新,开启了智能交互的新纪元。
四、埃森哲在生成式AI领域取得显著增长,全球AI人才队伍不断扩大
全球咨询巨头埃森哲在2024财年第三季度报告中宣布,公司在生成式人工智能(AI)领域的销售额达到20亿美元,显示出其在这一关键技术领域的领先地位。首席执行官Julie Sweet在收益电话会议中分享了公司如何利用生成式AI帮助全球食品和饮料公司创造新价值,并介绍了公司开发的数字货架控制台试点和GenAI引擎,以加速电商内容创造并优化销售。
此外,埃森哲正在稳步扩大其数据和AI人才队伍,目标是到2026财年末将人才从40,000人翻番至80,000人。公司还与澳大利亚国民银行等合作伙伴建立了合作关系,共同实施和扩展生成式AI。去年,埃森哲宣布投资30亿美元于其数据和AI实践,并在达沃斯世界经济论坛上重申了每年拨款10亿美元用于员工生成式AI培训的承诺。埃森哲还与Anthropic和AWS等合作,培训工程师成为使用Anthropic模型的专家,并与Cohere合作,加速企业采用生成式AI。
五、腾讯元宝全新版本:处理千万字文本,解析多文件,生成图表,搜索更智能
腾讯元宝发布全新版本,提升了对超长文本的处理能力,可处理长达 1000 万字的单文档文本,适用于长篇小说、企业报告等。同时,它还能一次性解析多达 50 个文件,支持多种文件格式。此外,基于解析内容,元宝可以自动生成多种数据图表,帮助用户进行数据可视化。它还支持多种图片格式的识别和解析,以及 URL 解析和对比分析。在搜索方面,腾讯元宝接入了微信搜索、搜狗搜索等搜索引擎,提供智能搜索结果,覆盖更广泛的内容源。这次版本更新不仅在技术上有重大突破,还为用户提供了更便捷和全面的服务,能极大地提升用户的工作效率。