从哲学认知论到人工智能,从信息互联网到知识互联网,思考数字采用与结构化人类知识的联系。
从信息互联网到知识互联网
信息互联网所依托的技术是储存、处理、传播信息的技术,获取信息的入口主要是谷歌这样的搜索引擎和门户网站,提供了除纸媒之外的获取信息的方式。但我们需要的不是信息本身,而是蕴含在信息中的知识,书籍、论文、互联网所承载仍然是信息,而不是知识。回顾人类历史,人类一直以来对知识的管理和利用的方式都没有发生什么变化,人类社会的知识一直以来都以一种形式存在着,那就是分布式地存储在世界各地人们的脑海里。
TMT行业的发展路线是用区块链技术把信息互联网重做一遍,还是继续奔跑在向知识互联网迭代的方向上?又或者两者交叉结合?
知识互联网的目标是把全球的信息连接成一张巨大的人类知识网络,让用户直接得到解决方案、决策意见。互联网的入口从搜索引擎变到嵌入在各种设备中的个人智能助理或者随身的可穿戴设备上,用户会被直接告知该怎么做,做多少及何时做,甚至直接由系统代为解决问题。
信息互联网时代产生的问题,尤其体现在信息数据量和复杂度的爆炸、人类知识复杂度的失控等方面。
在搜索引擎向知识图谱迭代后,知识库仍然存在几点缺陷:
- 从网络公开的海量碎片化数据中获取知识,效率低;
- 知识的真值随时间动态演化,知识之间可能存在新值与旧值的冲突,同时,知识的真值可能会湮没在错误值之间,导致知识真值发现难;
- 由于自然语言表达的多样性,存在大量同义和多义表达的知识,导致知识的语义理解难;
- 依托不同数据源的知识的质量与数据源的质量密切相关,导致知识的价值判断难。
同时,在对数据的处理上,只对非结构化数据(富文本文档、网页、多媒体)和半结构化数据进行解析,然后添加属性标签,是远远不够的。
信息互联网的问题将由知识互联网来解决。所以有没有更好的数据处理方式,体现出超越数据复杂性的自决策特性、克服知识复杂性的自研究特性?
RPA流程自动化、DAP数字采用平台、AR+AI运维等项目,均对此逻辑进行了回应。其中,在一众产品还停留在对数据进行收集、计算和加工的层面时,RPA和DAP已经着手对操作流程和业务本身进行收集和分析。