1955 年 8 月,一群科学家申请了 13,500 美元的资金,用于在新罕布什尔州达特茅斯学院举办暑期研讨会。他们提议探索的领域是人工智能(AI)。
虽然资金请求是谦虚的,但研究人员的猜想却不是:“原则上,学习的每个方面或智能的任何其他特征都可以如此精确地描述,以至于可以制造一台机器来模拟它”。
自从这些不起眼的开始以来,电影和媒体已经将人工智能浪漫化或将其塑造成恶棍。然而,对于大多数人来说,人工智能仍然是一个讨论点,而不是有意识的生活体验的一部分。
人工智能已经进入了我们的生活
上个月底,人工智能以ChatGPT的形式,从科幻小说的猜测和研究实验室中挣脱出来,进入了公众的桌面和手机。
这就是所谓的“生成式人工智能”——突然之间,一个措辞巧妙的提示可以产生一篇文章,或者把食谱和购物清单放在一起,或者以猫王的风格创作一首诗。
虽然 ChatGPT 是生成式 AI 成功的一年中最具戏剧性的进入者,但类似的系统在创建新内容方面显示出更大的潜力,文本到图像提示用于创建生动的图像,甚至赢得了艺术比赛。
人工智能可能还没有科幻电影和小说中流行的活生生的意识或心理理论,但它至少越来越接近于颠覆我们认为人工智能系统可以做的事情。
与这些系统密切合作的研究人员已经陷入了感知的前景,就像谷歌的大型语言模型(LLM)LaMDA一样。LLM 是一种经过训练以处理和生成自然语言的模型。
生成式人工智能还引发了对剽窃、利用用于创建模型的原始内容、信息操纵和滥用信任的道德,甚至“编程的终结”的担忧。
所有这一切的核心是自达特茅斯夏季研讨会以来一直日益紧迫的问题:人工智能与人类智能不同吗?
“AI”到底是什么意思?
要获得人工智能的资格,系统必须表现出一定程度的学习和适应能力。因此,决策系统、自动化和统计都不是人工智能。
人工智能大致分为两类:狭义人工智能(ANI)和通用人工智能(AGI)。迄今为止,AGI尚不存在。
创建通用人工智能的关键挑战是以一致和有用的方式,用所有的全部知识对世界进行充分建模。至少可以说,这是一项艰巨的任务。
我们今天所知道的大多数人工智能都具有狭隘的智能——一个特定的系统可以解决一个特定的问题。与人类智能不同,这种狭隘的人工智能智能仅在其训练的领域有效:例如欺诈检测、面部识别或社交推荐。
然而,AGI将像人类一样发挥作用。就目前而言,试图实现这一目标的最显着的例子是使用神经网络和在大量数据上训练的“深度学习”。
神经网络的灵感来自人类大脑的工作方式。与大多数对训练数据运行计算的机器学习模型不同,神经网络的工作原理是通过互连网络逐个输入每个数据点,每次调整参数。
随着越来越多的数据通过网络馈送,参数稳定下来;最终结果是“经过训练的”神经网络,它可以在新数据上产生所需的输出——例如,识别图像是否包含猫或狗。
当今人工智能的重大飞跃是由我们训练大型神经网络方式的技术改进推动的,由于大型云计算基础设施的能力,我们在每次运行中重新调整了大量参数。例如,GPT-3(为 ChatGPT 提供动力的 AI 系统)是一个拥有 1750 亿个参数的大型神经网络。
人工智能需要什么才能发挥作用?
人工智能需要三件事才能成功。
首先,它需要高质量、公正的数据,而且需要大量的数据。构建神经网络的研究人员使用随着社会数字化而产生的大型数据集。
Co-Pilot用于增强人类程序员,它从GitHub上共享的数十亿行代码中提取数据。ChatGPT 和其他大型语言模型使用在线存储的数十亿个网站和文本文档。
文本到图像工具(如 Stable Diffusion、DALLE-2 和 Midjourney)使用来自数据集(如 LAION-5B)的图像-文本对。随着我们将更多的生活数字化并为他们提供替代数据源,例如模拟数据或来自 Minecraft 等游戏设置的数据,AI 模型将继续在复杂性和影响力方面不断发展。
人工智能还需要计算基础设施才能进行有效训练。随着计算机变得越来越强大,现在需要大量工作和大规模计算的模型可能会在不久的将来在本地处理。例如,Stable Diffusion 已经可以在本地计算机上运行,而不是在云环境中运行。
人工智能的第三个需求是改进模型和算法。数据驱动的系统继续在一个又一个领域取得快速进展,这些领域曾经被认为是人类认知的领域。
然而,随着我们周围的世界不断变化,人工智能系统需要不断使用新数据进行再训练。如果没有这一关键步骤,人工智能系统将产生事实上不正确的答案,或者没有考虑到自训练以来出现的新信息。
神经网络并不是人工智能的唯一方法。人工智能研究的另一个突出阵营是符号人工智能——它不是消化庞大的数据集,而是依赖于类似于人类形成特定现象的内部符号表示的过程的规则和知识。
但在过去十年中,力量的天平已经严重倾向于数据驱动的方法,现代深度学习的“奠基人”最近被授予图灵奖,相当于计算机科学的诺贝尔奖。
数据、计算和算法构成了人工智能未来的基础。所有指标都表明,在可预见的将来,所有三个类别都将取得快速进展。