智能体的结构
迄今为止我们通过描述行为—在任何给定的感知序列下采取的行动—讨论了智能体,现在我们不得不将知难而进,去讨论智能体内部是如何工作的,AI的任务是设计智能体程序,通过它来把感知信息映射到行动的智能体函数,我们假设改程序在某种具备实际传感器和执行器计算装置上运行-我们称之为体系结构。
智能体=体系结构+程序
显而易见,我们选择的程序必须适合体系结构。如果程序要能够进行诸如行走这样的行动。那么体系结构最好有腿。体系结构也许只是一台普通的个人计算机,或者一辆自动驾驶汽车,车上载有一些计算机,摄像头和其他传感器。总而言之,体系结构为程序提供来自传感器的感知信息,运行程序,并且把程序产生的行动选择传送给执行器。在我写的文章中绝对多数的章节都是关于智能体的程序的,其实和机器学习程序大同小异。
1:智能体程序
其实我们设计的智能体程序都具有相同的骨架,他们从传感器得到感知信息作为输入,返回一个行动交给执行器。注意智能体程序和智能体函数之间的差别。智能体程序在于当前感知为输入,而智能体函数是以整个历史为输入的。智能体程序只把当前感知作为输入是因为环境无法得到更多的东西。如果智能体的行动依赖于整个感知序列。那么该智能体不得不记住全部感知的信息。
*智能体程序骨架还有其他的选择。例如我们可以让智能体程序成为协同程序。他们的环境和运行时异步的,每个这样的程序有一个输入和输出端口,并由一个从输入端口读取感知信息再把行动写到输出端口的循环过程组成。
我们将用一段在附录B中定义的简单伪代码去描述智能体程序,在上图中我们显示了一段相当普通的智能体程序,他记录感知序列,然后使用感知序列作为牵引,到行动表里查询该决策应该做什么。行动表明确的表示了每个智能体程序实现的智能体函数。要用这种方式来建造理性智能体。作为设计者,我们必须构造包括各种可能的感知序列的适当行动的函数表。
当我们考虑到为什么构造智能体的表驱动的方法是注定要失败是有益的,这个时候我们令P为可能的感知信息的集合。T为智能体的寿命(智能体收到感知信息的总量)。查找表将包括从1到T所有P的集合个条目。即便是国际象棋这样的在一个世界上微小的,良好表现的片段,查找表也将要至少包括10的150次方的条目。这些令人望而生畏的容量,意味着:1:这个世界没有一个实际的智能体可以保存该表的空间。2:设计者没有时间来创建该表。3:没有智能体能够从他的经验中学习正确的表条目。4:既是环境足够简单,可以得到一个可行的表容量,设计者仍然得不到关于如何该条目的指导
除了这些,AI的关键挑战是如何搞清楚编写程序,在可接受的范围内,从少量的代码而不是大量的表目中产生出理性的行为,我们有很多的例子是显示出在其他的领域上述做法是可行的,但是我们的问题是AI是否可以像我们人类一样可以产生一般的智能行为?但是我相信这个答案是肯定的。
在这个文章的以下部分,我想概述四种基本的智能体程序,他们几乎涵盖了所有智能系统的基础准则:
1:简单反射型智能体
2:基于模型的反射型智能体
3:基于目标的智能体
4:基于效用的智能体
然后我们将概括的解释如何把这些智能体转换成学习智能体。