人工智能中可能出现的任务环境范围显然非常广泛。然而,我们可以确定相当少的维度,并根据这些维度对任务环境进行分类。这些维度在很大程度上决定了恰当的智能体设计及智能体实现的主要技术系列的适用性。
完全可观测的与部分可观测的:如果智能体的传感器能让它在每个时间点都能访问环境的完整状态,那么我们说任务环境的完全可观测的。如果传感器检测到与动作选择相关的所有方面,那么任务环境就是有效的完全可观测的,而所谓的相关又取决于性能度量标准。完全可观测的环境很容易处理,因为智能体不需要维护任何内部状态来追踪世界。由于传感器噪声大且不准确,或者由于传感器数据中缺少部分状态,环境可能不分可观测。例如,只有一个局部灰尘传感器的真空吸尘器无法判断其他方格是否有灰尘,自动驾驶出租车无法感知其他司机的想法。如果智能体根本没有传感器,那么环境是不可观测的。在这种情况下,有人可能会认为智能体的困境是无解的,但是正如我们在第4章中讨论的那样,智能体的目标可能任然可以实现,有时甚至是确定可以实现的。
单智能体的与多智能体的:单智能体和多智能体环境之间的区别似乎足够简单。例如,独自解决纵横字谜的智能体显然处于单智能体环境中,而下国际象棋的智能体则处于二智能体环境中。然而,这里也有一些微妙的问题。首先,我们已经描述了如何将一个实体描述为智能体,但是没有解释哪些实体必须视为智能体。智能体A(例如出租车司机)是否必须将对象B(另外一辆车)视为智能体,还是可以将其视为根据物理定律运动的对象,类似于海滩上的波浪或者随风飘动树叶?关键区别在于B的行为是否倍最佳的描述为一个性能度量的最大化,而这一性能度量的值取决于智能体A的行为。
确定性的与非确定性的:如果环境的下一个状态完全由当前状态和智能体执行的动作决定,那么我们说环境是确定性的,否则是非确定性的。原则上,在完全可观测的确定性环境中,智能体不需要担心不确定性。然而,如果环境是部分可观测的,那么它可能是非确定性的。
大多数真实情况非常复杂,以至于不可能追踪所有未观测到的方面:出于实际目的,必须将其视为非确定性的。从这个意义上讲,出租车驾驶显然是非确定性的,因为人们永远无法准确地预测交通行为。
回合式的与序贯的:在回合式任务环境中,智能体的经验被划分为原子式的回合。在每一个回合中,智能体接收一个感知,然后执行单个动作。至关重要的是,下一回合并不依赖于前几回合采取的动作。许多分类任务是回合式的。但是,在序贯环境中,当前决策可能影响未来所有决策。国际象棋和出租车是序贯的:在这两种情况下,短期行为可能会产生长期影响。因为在回合式环境下智能体不需要提前思考,所以比序贯环境要简单很多。
静态的与动态的:如果环境在智能体思考时发生了变化,我们就说该智能体的环境是动态的,否则是静态的。静态环境很容易处理,因为智能体在决定某个操作时不需要一直关注世界,也不需要担心时间的流逝。但是,动态环境会不断的询问智能体想要采取什么行动,如果它还没有决定,那就等同于什么都不做。如果环境本身不会随着时间的推移而改变,但智能体的性能分数会改变,我们就说环境是半动态的,驾驶出租车显然是动态的,因为驾驶算法在计划下一步该做什么时,其他车辆和出租车本身在不断移动。在用时钟计时的情况下国际象棋是半动态的。填字游戏是静态的。
离散的与连续的:离散/连续的区别适用于环境的状态、处理时间的方式以及智能体的感知和动作。
已知的与未知的:严格来说,这种区别不是指环境本身,而是指智能体(或设计者)对环境“物理定律的”认知状态。在已知环境中,所有行动的结果都是既定的。显然,如果环境未知,智能体将不得不了解它是如何工作的,才能做出正确的决策。