1. 数学不是四则运算、几何、代数
当我的小女儿,还在咿呀学语时,还没能熟练说出“我要吃面条”的时候,她已经可以在爬楼梯的时候,从1数到9。我曾经和老婆求证过,我们都没有采用特殊的方法,刻意教会小丫头数数字。所以,我还专门写了一个小短文,以强调性地将这种超级能力进行描述。 点击查看小短文
这个简单的1到9的序列,就属于“自然数”,它是人类计量自然的数量或者标记自然的序列关系的方法。譬如,用来描述家庭的人口,描述每个人的年龄,描述家里房屋的个数等等。
在上学以后,我们还会学习到大量的人类已经总结的数学经验,从小学开始逐步学习到:加减乘除的四则运算,负数,分数,未知数,形状与面积,函数,微积分等数学经验。同样,如果我们不从事与数学相关性很强的专业的话,离开大学之后,基本上最多运用的就是“四则运算”和自然数,就连分数都很少使用,接触到小数的地方无非是计算利息的时候。就连遇到超市的促销优惠,看起来用了小数,还是被默默转换成了“几毛几分”的整数。
而且,在我们所看到的新的数学应用领域:人工智能,基本上不是运用四则运算。而是广泛使用逻辑计算、分类统计、非线性方法……
——几年前,我在与朋友们分享的时候,谈到人际关系的计算方法,很多人觉得无法理解,是因为他们的大脑里在听我讲诉的时候,听到“计算”两个字的时候,就认为是“加减乘除”。
2. 逻辑计算与非线性系统
对于逻辑计算,最初接触这个运算方法,应该都是在“计算机知识普及课程”上。现在的中学7年级以后,应该都开设了计算机课程,或多或少都会介绍这种运算的基本方式,譬如:逻辑或、逻辑与、逻辑异或等。不过大多数的人,和我最初接触这个运算方法的时候的想法应该是类似的,认为这种运算是为计算机所特有的。
然而,随着对数学的历史有所了解的话,就会知道以人类的聪明程度,这种运算方法绝不是最近百年的成果,起码是200多年前就成熟的运算工具,只不过在计算机的实现过程中,发现计算机采用二进制计算的时候,运用这种逻辑运算的方法,才能实现基本的四则运算。并且比起采用十进制进行“计数”运算,要高效得多。
3. 人工智能,他不仅仅使用四则运算
当我们再翻看最近非常热门的人工智能的时候,会发现更多的数学计算方法被使用,我们在这里就简单提出一点点。
3.1. 统计学的分类算法
这是最早的人工智能的经验获取方法,目前基本上所有的大数据和人工智能分析方法,都是站在统计学经验之后的(或者称为之上)。在进行大数据和人工智能的项目的时候,基本上都要进行统计学的数据处理操作,譬如:
◦ 将标定数据或者文字数据转化为数字;
◦ 将不完整的数据进行补全,相邻平均数、整体平均数、指定数据补全等等方法,所采取的具体方法与数据的含义和数据的采集方法有关;
◦ 进行数据置信度检查,以发现数据采集的偏差,这种偏差可能出现在设备的误差、采集人对数据定义的理解分歧、采集过程中的数据污染(譬如经常接到业务部门提出请求,某些数据导入的时候人为操作错误)……
◦ 其他的统计学方法还有很多。
3.2. 人工智能的人工神经网络
现在在人工智能领域很火的“人工神经网络”,只是人工智能工具的一个新人,不过因为他克服了传统方法的一些弊端,并且成功解决了我们后面提到的非线性分类的问题。尤其是最近10来年,成功将“人工神经网络”的程序结合大数据、云计算,延伸到了最基本的人际交互活动,最出名的行为有,图像识别:应用到了无处不在的视频监控;下棋:尤其是 下围棋,还多轮绝对优势地战胜人类。 使得”人工神经网络“变成了一个非常NiuBi的东东。
但是,从最基本的数学入门知识来看,”人工神经网络“主要就是几个函数:
◦ 用于处理状态变化的函数,当输入函数发生变化的时候,输出的状态就是一个跳变;
◦ 用于处理状态变化,但在某个区间是能够反应出一个线性变化的函数;
◦ 用于处理线性的数据变化的函数,就是很常见的一条直线,表示参数和输出的比例关系、变化关系的函数,可以输出为大小对比、数列排序等;
3.3. 激活函数的基本信息
借用MatLab的一个神经网络的拓扑图,我们可以看到,上图中可以分为四个大的部分,其中:
1. 最左边的部分,是Input,也就是输入数据,这个输入数据并不是原始的标定数据,一般情况下会进行一定的数据预处理,这个在前面已经提及;
2. 中间的左边部分,是第一个类型的神经网络,在“10”这个数字的上方,我们可以看到一个蓝色的示意图,他代表了这个方框的函数类型。这个示意图,就是用函数的输出曲线来表示的。可以看出这是一个Sigmoid函数。
3. 中间右边的部分,是第二个类型的神经网络,在“0”这个数字的上方,可以看出这个示意图和左边的那个明显不一样,所以可知这个函数和左边的函数所做的计算是不同的。
这组神经元,他的运作是这样的
1. 首先,他是知道Input和Output的,也就是说,是知道输入和结果的;
2. 其次,他是需要计算出,如果按照两种数据处理方法,这两组数据之间,有什么样的关系;在“专业”的叫法上,会被叫做“学习”或者“训练”。实际上,我们很多“会计岗位”的运用过Excel的人都做过与之类似的相同的事情。在给领导做年度销售数据的展示的时候,经常会被要求”添加趋势线“,这个添加趋势线的过程,就是用一个等差序列(时间)和销量变化数据之间,进行一个训练。如果洋气一点,可以说,“让人工智能算法来看一下这个业务是不是还可持续发展”。下图就是一个Excel的趋势线选项截图。我们通过趋势线的选项,可以显示出最终计算出的这个趋势线图形的函数公式:y = 0.5724x + 2.3712
3. 计算的过程中,有点不同于上面的趋势线那么简单,毕竟人家叫人工智能呀,岂能只做序列关系这么简单的计算呢。由于这个计算过程往往是非常有“领域”的知识要求,甚至是跨学科的组合,所以当一个人工智能被发布的时候,会把这个部分黑箱成两个字“学习”。
4. “训练”或者“学习”的结果,就是算出这个神经元的参数,也就是上面说的神经元框框里的W和b。如果借用刚才PowerPoint的趋势线的函数“y = 0.5724x + 2.3712“的话,W就是0.5724,b就是2.3712。一个是图像的函数关系,一个是图像的偏移值。一个最简单的45度倾斜的函数图像就是y=x,这个图像是穿过“原点”的,但是如果数据不是那么巧,跟原点有一定的距离呢?如果以y轴的数据为距离标记的话,就是这个b。下图就是两条函数,y=x 和 y=x+1的图形。
4. 再复习认知心理学中的“记忆”
在心理学领域,对“记忆”或者“思维”或者“意识”的描述,为了区别历史上被多个学科、人们的日常口语描述中的“记忆”、“思维”、“意识”。将大脑中存放的感知世界的结果和大脑自己思考的结果,换了一个名称,叫做“表征”,之所以叫做“表征”,我想,一方面是和已经广泛使用,歧义颇多的“意识”进行区分,一方面也是说明,这个东东,并不是大脑的实际存放“记忆”的结构,只是人类能够观测到的界面“表征”。
4.1. 表征
在认知心理学的领域中,表征作为一个非常基础的知识,构建了很多认知心理学的基本架构。从一个人对外界的刺激信号的感觉器官到达表征,在时间上可能是0.001秒左右的时间,然而在这个过程中,却要经历几个层次的运算。
以视觉为例,简单来说,光线到达眼睛以后,在视网膜形成电位变化,并不是一开始就形成“图像”,而是先通过明暗的电信号差异,形成物像轮廓。然后再进行色彩的辨别、纹理的辨别……。最后,会将这个图像“识别”出来。
为什么会把“识别”两个字加上引号呢?由于能够看到这篇文章的人,从三岁以后,基本上已经在使用“语言”来描述自己的心理活动,譬如:那种胃部空旷的焦灼感受,被抽象为汉字的“饿”、英文的“hungry”,这里的“识别”,很多人就会认为,是识别出物体的“名称”,实际上远远没有到达那么高级的层次。这个“识别”,只能说是你见到了一个从没见过的东西的状态。
当我们能够到达大伙所习以为常的普通的识别的时候,就已经走入了“知识的范畴”,就是非常高级的思维层次了。在这个层级就完全是“表征”的世界。
发现这个从感觉到表征的过程,有许多猫咪作出了巨大的牺牲,各位有兴趣的可以去参考“《大话深度学习2:折磨了那么多只猫,还得了诺贝尔奖?》”
4.2. 图式
图式是一种对记忆的结构进行抽象命名的名词。他代表了人类的记忆是一种纷繁复杂进行互相关联的关系状态。最普遍的阅读的时候,大脑当中就有:颜色、字体、语言、上下文、剧情等等复杂的图式结构被调用。
同时,图式还支持类似计算机中的“泛型”,也就是使用“代词”的方式,在可以抽象地代替具体的事、物的方法。这种方法让人的交流可以出现大量的不确定,也可以应对大量的变化。“当你看到的时候把他交给你的事情做好”,这一句简单的话,却可以完成大量的不确定表达。——不要认为是人类的智慧早就了这个五彩缤纷的世界,是因为自然进化的结构的支持,才让人类如此缤纷多彩。——做过系统设计的人都会体会到,在底层架构上不支持的功能,依靠上层行为规则勉强实现的时候,效率是非常低下的。
5. 人际关系的基本数学模型
在借鉴了以上的知识基础后,再运用一些“社会认知”的经验、知识,我们就可以勾勒出一幅人际关系的“图式”模型,并且将其中的大部分“表征”用数学的方式表示出来。
在《社会认知》科学当中,非常深入地研究了在人所组成的这个人际社会中,从交流到人际印象到群体效应等等方面的科学规律。还研究了群体之中语言、行为、交流等规律和现象。而且在《Social Intelligence》章节,也研究了是否能够用数学方法表述人类在社会活动中的智能活动架构。
5.1. 人际关系模型的基本原则
1. 观测受限原则
由于人际关系的数据模型,还是有大量的重要数据是人的思维结果,但是由于目前人的思维具体结构还是不可以观测,所以必须要时刻提醒,在现有的技术背景下,还是有大量的数据不可以观测。这种观测包括两种结构,
• 一个不能观察:即没有表情、没有行动的表现,但是有内心活动的新的表征产生。
• 另一个是即便观察到了,但是,由于观察到的现象无法分类,以至于不能称为有效测量。
其实,这个原则在历史上,中国人曾经有过非常成功的突破的案例,那就是“中医”。中医的知识结构中,绝大多数是不符合“解释与逻辑”的结构体系的。也就是说,无法回答“原因与结果的关联关系”。但是,却可以总结出经验,用“表象A、表象B”与“表象C”的关联关系,来计算或测算身体的变化。这就像我们很多人无法理解这种“头痛望舌头”的规律一样,今后对于不可观测的思维活动的测量方法,一定也是采用突破人类常规逻辑的方法。
• 再一个就是:可观察到的行为,与决定之间的欺骗现象。用中国古典的说法就是“兵不厌诈”。
2. 非线性原则
对于能够观测到的活动,也有大量的有效结果,是非线性的。前文我们提到了一些非线性系统的信息,我也在之前的分享的文章中描述过非线性的一些常见现象,现在我们再复习一下
•局部不响应:
从反对、到中立、到支持,我们可以看到的行为可能有:咒骂生气、默不作声、手舞足蹈;这些行为最终会被转化为数字序列进行计算,但是,并不代表就一定是一个等比、等差序列。他代表的是互不关联的不同的东西。其数据之间,大部分不能进行加减运算。
•无对立数据:
从人的关系活动来看,有正向关系的时候,人与人互相之间可能会有合作活动。但是,对于负向关系,人与人之间一般情况下没有相互活动,对于观察来说,负向关系和没有关系的观测结果是一样的。
3. 场景原则
在社交环境下,一个人的表现,会和他所对所处环境的进行判断,以确定自己的行为符合环境,按照行为的显著区别,一般可以分为以下的环境类型。
•私下:
中国哲学中指出的是类似于动物居于深幽的巢穴之中的场景,也是君子慎独的那种独处的环境。这种场景下,人处于最安全、最放肆的环境中,是最真我的释放。这种情况下即便是裸身也是无所顾忌的。
•熟悉:
一般情况下,指的是与家人、朋友在一起的环境下,在某些可以扩展到战友、同事。在这种场景下,人处于安全、却不放肆的环境中,仍然需要顾及一些人际礼数。
•公众:
这种场景,就像是逛街、超市、菜市场里的顾客。在这种场景下,人的状态属于最中性的,也是绝大多数商品所定义的消费环境。
•公开:
这种公开指的是在公开的场合表现自己。在众目睽睽之下,往往是需要最为谨言慎行的时候,几乎所有的表达都会经过改造,以达到最期望的效果。
•危险:
在危险的场景下,行为的决策会具有非常大的不确定性,在熟悉环境下很普通、常见的消息,都会被赋予更多的含义。
5.2. 人际关系模型
1. 不得不面对的测量难度:一个能够被测量和表达的人际关系模型,是一种受限的模型,因为有很多信息是无法观测到的,并且受到场景的限制。
2. 能够被测量到的行为:,是一个分类与矢量(强度且有方向)判断的过程,并且综合场景的分类判断。
基于这样的背景,我们把人际关系的模型描述为:人与人之间的关系预期,并通过在一定场景下的行为分类,以验证关系分类是否正确的过程。
5.2.1 人际关系的定义
人际关系的定义,也可以说是是对人际关系的分类。从人们对人际关系的“称呼”或者“命名”来看,其背后带有很显著的“分类”行为特征。
用通俗的方式,并引用人们日常在人际关系方面的体会,能够很直观体会出这种“分类”特征。
通常情况下,我们会把人际关系称为:“夫妻、朋友、父子、母子、同事”等类别,并且在以下方面可以典型地将这些关系进行区分:
1. “思想交流”行为不一样:
典型的是在“思想”的共享不同,这个“思想”的含义是什么呢?主要指一个人对另一个人共享自己想法的程度,譬如:对一个事情的看法、对另外一个事物的好恶、价值观、人生观等,“思想”的成果。可以明确的是:夫妻之间、朋友之间、同事之间,共享的”思想“类型是区别很大的:和朋友不会分享“你爱不爱我?”这样的主题。
2. 资源行为不一样:
典型的是在“物资”共享不同,这个方面有丰富的经济性质。譬如:钱给不给你用……,房子给不给你住……,美味佳肴给不给你吃……。
3. 语言行为不一样:
由于人际关系的不同,在语言中的“名词:称谓”上就显然不一样,“语气词”上也不一样。
语言作为观测人的思想的窗口,是人类对智能研究的一个重要载体,甚至在前面提到的“表征”,专门提出了,本能的“智能”,在成人熟练掌握语言后,往往被“语言表征”替代,就是说,人在最初没有学会语言表达之前,譬如新生儿阶段,也是很“智能”的。但是,当十岁以后,人的大脑运算过程和运算结果,能够被关注到的几乎都是由“后天学会的语言”进行描述。并且随着书本知识的积累,为了让自己的思维越来越能够贴近”科学“,在我这个年纪的人,越来越缺少那种“直觉而来”的思维。
5.3. 人际关系的参数权值
5.4. 人际关系的偏差
5.5. 人际关系的损失
5.6. 行动与定义的错误分类
待续
在过去的一年多的时间里,因为工作原因,大量的时间在解决一些超出预期的项目任务,由于:项目的时间、成本、产出、范围、变化、质量,以及项目本身的各种文案、会议……占据了大量时间,在身体上、思考上,都占据了我的大量时间资源。
今年开春以后,一方面恢复了规律的锻炼,一方面就是恢复对《认知科学》的学习和思考。
2018年3月17日
连云港
Wollaston