智能体与环境
什么是智能体?
智能体可以被视为通过传感器感知所处的环境并通过执行器对该环境产生作用的东西。
假设现在每个智能体都能知觉自己的行动,但不一定能够感知行动的效果。并且用感知信息来表示任何给定时刻智能体的感知输入。智能体的感知序列是该智能体所收到的所有数据完整的历史。
智能体函数和智能体程序的区别?
智能体函数是通过智能体程序实现的。智能体函数是一个抽象的数学表示。智能体程序是一个具体的表现。智能体的概念只是我们用来分析系统的一个工具。而不是用来把整个世界划分为智能体和非智能体的绝对特性。
智能体应有的几个概念
1:好的行为表现:理性的概念
具体案例:真空吸尘器案例
理性的智能体是做事正确的智能体
性能度量“你所要求,即你所得”。性能度量是智能体成功标准的具体化,作为一般的规则,最好根据实际在这个环境中希望得到的结果来设定性能度量。而不是根据智能体应当表现的行为。
2:理性
理性智能体的定义:
对每个可能得序列,根据已知的感知序列提供的证据和智能体内建的先验知识。理性智能体应该选择期望使其性能度量化最大的行动。
任何指定的时刻。什么是理性的判断?
1:定义成功标准的性能度量。2:智能体对环境的先验认识。3:智能体可以执行的行动。
4:智能体到未知的感知序列。
全知,学习和自主性
理性和全知的概念:
一个全知的智能体知道它的行动产生的实际结果并且做出相应的动作。但一个全知者在实际情况中是不现实不可能的。理性不等于完美。理性是使期望的最大化。而完美是使实际性能的最大化,所以完美是对一个智能体不合理的要求。因为理性的选择取决于当时的感知序列。
所以理性智能体在行动前应当观察行动。因为观察有助于最大化期望性能。为了修改未来的感知信息而采取行动的那个过程称为信息收集。这也是理性的重要的一部分。
对于理性,不仅是需要智能体收集信息,而且需要智能体尽可能的从他感知的东西中进行学习。智能体最初的设定可以反映了环境的一些先验知识,但是随着智能体获得经验。这些知识会被改变或者增加。有一些极端的情况中环境就会被完全当成先验知识。在这样的情况下,智能体不再需要感知和学习,他只需要正确的感知即可。
一般来说成功的智能体会把智能体函数的计算任务分成三个不同的时期:
1:设计智能体的时候,设计者会完成一些计算
2:思考下一步的时候,智能体会做更多地计算。
3:当他从经验中进行学习的时候他要进行更多地计算来决定如何修改自己的行为。
现阶段拓展一个智能体依赖于设计者的先验知识而不是它自身的感知能力。我们就说该智能体缺乏自主性。理性智能体应该是自主的。他应该能够尽可能的学习,以此来弥补不全面或者不正确的先验知识。当得到关于经验的环境的充分地经验后。理性智能体的行动才会有效果的独立于他的先验知识,从而与学习相结合后使得设计一种在很多不同环境下都能成功的理性智能体成为可能。
智能体所处环境:
首先要考虑任务环境,这是理性智能体要解决的基本问题。而任务环境的风味会直接影响到智能体程序的适当设计。
现在详细说一下任务环境。典型的案例是自动驾驶出租车案例。首先设计智能体时,第一部一定要详细说明任务环境,而且要尽可能的全面。对于智能体感知环境首先需要PEAS(性能,环境,执行器,传感器)。对于任务环境的属性,如果一个智能体的传感器在每个时间点上都可以访问到获取到所处环境的完整状态,那么我们就可以说这个环境是完全可观察的,如果智能体的传感器能检测能够所有与行动选择相关的方面,那么这个就可以归类于有效可观察门类。并且相关性取决于性能度量。
对于确认性和随机性,如果一个环境的下一个状态完全决定于当前的状态和智能体的动作。那么我们可以说该环境是确定性的。否则可以说是随机的,原则上智能体是完全可以观察的,确认的环境。但是在一些环境中无需考虑非确定性,不过如果该环境部分是可以观察的,那么他可能表现是随机的。如果环境是确定性的,除非有其他的智能体的影响。那么我们称该环境是策略的。
对于片段式和延续式的问题,在片段式的任务环境中,智能体的经验被分成一个个的原子片段,每个片段的组成包含了智能体所感知的信息以及进一步执行的单个行动。最为重要的是下一个片段,不依赖于以前的片段中采取的行动。在片段或者环境中,行动的选择只取决于当前的片段的自身。大多数分类任务属于片段式的或者任务环境要比延续性的任务简单的要很多。因为智能体有些时候不需要前瞻。
对于静态或者动态,如果环境在智能体思考时发生变化,那么我们称该环境是动态的,否则是该环境是静态的。如果该环境本身不随时间的流逝发生的变化而变化。但智能体的本身性能评价随时间的变化而变化,我们就称其为半动态的。
对于离散和连续,离散的区别可以应用于环境的状态,时间的处理方式,以及智能体的感知信息的行动和能力。但是对于单智能体与多智能体的方面,在多智能作为理性的设计与单智能体的环境设计相比相差很远。比如像是通讯作为理性的行动出现在多智能体的环境中,在一部分可观察的环境中,随机是理性的,因为他可以避免预测之中的缺陷。
未完待续
参考文献
[1]Nils J Nilsson.人工智能[M].机械工业出版社,2000.8.
[2][4]M Wooldridge, R Jennings.Methodology for A-gent-oriented Analysis and Design [J]In AAAI-9987-98.
[3]赵龙文,侯义文斌.智能软件:由面向对象到面向A.gent[J].计算机工程与应用,2001(8):41-42.
[5][6][11]周昌乐.无心的机器[M].湖南科学技术出版社,1999.20,25,216.
[7][13]克劳斯.迈因策尔.复杂性中的思维—物质,精神和人类的复杂动力学[M].中央编译出版社,1999.114-121.
[8][9]程毅,等.软件Agent是一个计算实体[J].计算机工程与设计,2001(1):41-43
[10][20]汉肯.控制论与社会—关于社会系统的分析[M].商务印书馆,1984.136,157.
[12][14][21]黄小兵,唐文胜.基于Agent系统的概念.方法和应用[J].计算机与现代化,2000(4):6-11.
[15][16]张维迎.博弈论与信息经济学[M].上海三联书店,上海人民出版社,1996.4.
[17][18][19]余永定,等.西方经济学[M].经济科学出版社,1999.162-185,705.
The Frontier of AI____The Deveiopment of Agent Theory and Its Philosophy
XIANG Hou-jun ZHOU Chang-le
(Zhejiang University1.Humansm School2.Information School Hangzhou 310028,China)
Abstract:Adopting philosophical,social and economic viewpoints,the thesis analyzes and discusses the philosophy of Agent theory, the front research field of computer and AI,thereby confirming the value of adopting a systematic viewpoint in Agent re-search,espcially that of the introduction of social intelligence to bread the limits of individual intelligence,and confirming the im-provement of epistemology and methodouction of social intelligence to break the limits of individual intelligence, and confirming the im-provement of epistemology and methodology in the research. The thesis also studies such exploratory issues as the game,utility,rea-son,norm and common knowledge intelligence;interaction;reason