元宇宙背后,你应该了解的人工智能核心技术

原创:王稳钺
资料来源:单博

一、真假元宇宙

最近元宇宙这个概念非常火,网上的资料也是铺天盖地。但个人认为元宇宙这个概念里蹭热点的人非常的多,元宇宙还是处于概念为主的阶段。很多人说自己在做元宇宙,但其实都是真假难辨的状态。在元宇宙这个词出现之前,其实有很多相关的概念,比如虚拟现实( VR )、数字孪生、自动化等。数字孪生其实就是仿真建模,比如说我国的国产的飞机 919 等大型的机械化的电气化的设备在生产的过程中,都会涉及到跟数字孪生相关的一些数字仿真。元宇宙这个概念,其实应该更加理性去看待,关于元宇宙,人们达到了一个共识就是它一定是确定性的一个未来,但是它如何、何时能够到来,还是一个未知数。

关于一个技术的发展,经常可以用 Gartner 技术成熟度曲线来对它进行一个衡量。在一个技术诞生初期会有一个爆发期,但是往往会带来一个过高的期望,来到一个峰值。峰值过后就会有一个下降的冷却期。之后,在泡沫崩盘之后会有一个缓慢爬升的过程,最后才能投入到真实的生产科研这些应用当中。

如果要实现能够在一个虚拟的世界里面生活、互联、人际交往,其实还需要大量的基础设施,软硬件的发展、市场的培育、内容的建设,需要这几点甚至更多的协同才能实现。所以元宇宙现在有真有假,众说纷纭,所以一定要用相对冷静和务实的态度来看待元宇宙。

二、人工智能现在在哪里?

人们普遍认为AI是离元宇宙相对较近的方向,我们可以通过 AI 和元宇宙之间的关联来了解一下 AI 技术现在发展到了什么程度,未来还有哪些发展。元宇宙中一个重要的方面就是人机交互和信息的传递,这在 AI 当中也有很多应用。例如抖音,有没有发现抖音越刷越爱看呢?每天推荐的都是感兴趣的内容。还有淘宝,即使最近不太想买东西,偶尔也会打开淘宝看一看。淘宝就会根据最近浏览过的商品来推荐可能感兴趣的商品,比如最近浏览过手机耳机,就有可能会推荐其他电子产品;搜索过衣服,就会推荐很多符合审美,符合价位的服装。除此以外,包括很多音乐软件也有猜你喜欢等等歌单的推荐。这些都是属于推荐系统在日常生活中的应用。

计算机视觉在日常生活中也有广泛的应用。比如说手机解锁,上下班刷脸打卡、高铁站机场等需要通过人证比对来做身份的检验、自动驾驶等等。自然语言处理同样如此,人们的生活也都离不开有道词典等翻译软件。

三、认识人工智能

很多书、教材中都会说人工智能没有一个明确的定义。但是我们可以将它定义为——为机器赋予人的智能,即像人一样感知,像人一样思考,像人一样行为。其实感知、决策控制这三点就是机器要具有的人的智能。感知,就像人的视觉、听觉;思考,像人一样在不同的情况下要做出决策;做出决策,还要执行,这就属于像人一样行为。

在人工智能诞生之初,人工智能这个词是怎么来的呢?其实它最早和控制论是非常相关的。其实控制论和人工智能是一个相辅相成的概念。控制论这个词出现得更早,其实它就是早期的人工智能概念。随着学术界出现了争执和风波,一群 AI 的学者,为了脱离原本维纳的控制论,所以起了一个新词叫人工智能。所以如果在谷歌的词频里面搜索一下的话,也可以看出来,早期的时候,在五六十年代的时候,控制论这个词迎来了一波高峰,但后来就衰落了。

那现在这个时代,当谈论到人工智能的时候,其实是在谈两个概念,即算法工具和智能硬件。因为人工智能其实是在硬件的促进下发展的,三驾马车指的就是算法、算力和数据。关于算法工具,其实就是深度学习和强化学习。AlphaGo 就是将深度学习和强化学习相结合产生的。硬件系统主要的就是指移动端的芯片,比如手机里的芯片。

今天人工智能算法中最火的名词就是深度学习了。但是人工智能有许多流派,符号主义、连接主义、统计主义、行为主义等等,在这些流派下面会诞生不同的算法的门类,不同的算法门类里面细节还有很多算法,人工智能的算法非常多,比如说知识图谱、专家系统、遗传算法等,他们都属于 AI的算法。但最近十年是深度学习比较流行,但是如果真的想扎根于人工智能的话,不要放弃其他算法,因为人工智能的发展,一直都是三十年河东,三十年河西。在最早的时候符号主义和专家系统特别流行,现在就不流行了,但没人知道十年之后他不会再次流行。

在人工智能诞生之初,科学家会想怎么实现人工智能呢,然后就诞生了不同的流派。在最早符号主义比较占上风,科学家们都认为通过这种基于规则的数理逻辑、数学逻辑(加减乘除、与或非)就可以实现人的智能。因为计算机刚刚诞生的时候,就是利用这些进行计算的。但是即使到了现在人脑的原理,人们也没有完全的理解,现在的电脑也还是不能代替人脑,所以符号主义没有走得很远,逐渐没落了。

其实在人工智能诞生的早期,还有另外一个流派就叫做连接主义,或者叫连接流派。它是模拟大脑的连接结构。该流派主要是模拟人脑的结构。人脑由神经元组成,那机器脑就由人工神经元构成;人的大脑皮层是一层一层连接起来的,那机器里面的大脑就由一层一层的人工神经元连成。这就是连接主义这一派的思路,所以这也是神经网络和深度学习所属的流派。所以从最早人工神经元发展到多层感知机,然后发展发展到神经网络,这些学习算法发展到现在就成为了深度学习。

其实行为主义也一直在流行。行为主义的代表算法就是遗传算法。遗传算法是强化学习的一个特例,这一类的算法是模拟人的行动和决策的,人类看到什么事情,会做出什么样的行动。比如,当人类看到前方有障碍物会躲避,那这个从感知到行动的行为,科学家认为如果机器也能像人一样有从感知到行为的映射,那机器就具有了人类的智能,所以叫行为主义。

最后一个流派叫统计主义,这个非常像数理统计这一派的,它其实就是机器学习,因为机器学习的全称叫做统计机器学习。那这一类的流派的科学家就希望系统可以自动地从数据中获得知识,而不需要人告诉他,也就是在数据,也可以叫经验中学习。在经验中学习,其实跟人的学习的过程是很像的。比如监督学习和无监督学习,就很像人类的学习的过程。机器学习通常被划分为监督学习、无监督学习和强化学习。监督学习就类似于老师在说,哪个是正确的哪个是错误的。在这种标签或者老师的监督下,在数据中产生算法,产生模型。监督学习非常适合解决分类或者回归类问题。监督学习就没有老师了,相当于完全自习的状态,所以无监督或者无老师学习,它很适合解决一些聚类的问题,没有明显的标签或者是没有明显的好坏,甚至没有明确的对错的一些问题。比如社交网络里面的一些舆情的信息等等,都可以用聚类来做分析。另外一个就是强化学习,它适合解决的是决策问题,比如说机器人的控制、自动驾驶、下围棋、下国际象棋等等。当然围棋因为它的难度比较高,在 2016 年的时候才被 AlphaGo 解决,但也并不能叫完全解决。

机器学习之后就发展到了神经网络。神经网络根据网络结构可以分为两类,即卷积神经网络和递归神经网络(或循环神经网络)。卷积神经网络更适合于解决空间相关的信号,比如照片。递归神经网络,或者循环神经网络,它适合解决与时间相关的信号,比如语音信号。

深度学习是什么时候得到发展的呢?在 2012 ImageNet 挑战赛里,Alex 提出了一个网络,把深度学习变成了一个参数可调可学习的状态。所以从 2013 年开始,深度学习就蓬勃发展了。但这一个挑战赛最早只在学术界有一定的影响力。什么时候工业界和大众都开始关注到深度学习呢?其实是 AlphaGo 战胜人类之后,但战胜人类的是深度强化学习,但反倒让深度学习火了,这也是非常有意思的情况。

四、像人一样感知——以人脸识别为例

如果让机器实现人脸识别,总共分几步呢?其实有三步就够了。如果要求高的话,就需要有四步。第一步就是做一个人脸检测,先要检测出人脸区域,再去识别。但在检测和识别中间还需要检测关键点。什么叫人脸的关键点呢?比如鼻子、嘴巴、眼睛、眼角、鼻翼、嘴角等等。关键点的作用是因为人脸识别不一定是正对镜头,有可能是侧面,通过关键点就能把偏的人脸矫正,然后通过正的人脸去比对。

解决人脸的检测问题又分几步呢?人脸检测其实最早分为三步,在深度学习的发展之后,人脸检测流程就变简单了。虽然算法变复杂了,但流程呢变简单了,速度也变得越来越快了。现在有一些目标检测叫两阶段检测,例如 RCNN 系列算法。还有一阶段的算法,比如 YOLO,SSD 系列。在深度学习的驱动下,目标检测算法兵分两路,分为一阶段和两阶段。

五、像人一样决策&行动——以自动驾驶为例

就一辆车来说,让 AI 代替驾驶员的过程就是完全代替人的过程。那什么来代替人的眼睛呢?可以是激光雷达,但激光雷达的价格非常高;还有可能是摄像头,比如特斯拉,就不使用激光雷达,只基于视觉的障碍物检测;还可以是毫米波雷达。因为毫米波雷达它测距比较远,价格便宜,所以可以在汽车上装很多个。一般自动驾驶的计算设备就在车的后备箱中,由工控机、GPU 等组成。还包括一些执行单元,比如方向盘、油门等。

那要实现无人驾驶,要解决几个问题呢?第一要解决这种感知问题,比如车道线、障碍物等等。第二还要认知它,克服一些不确定性,增强检测的鲁棒性等等。第三就是决策,看到了障碍物,还要思考该如何规划轨迹。第四就是控制,最后就是执行了。另外,比如说高精度地图、定位感知和 GPS、北斗等等,这些也都是非常重要的环节。

在自动驾驶中,因为获取数据的传感器很多,比如有单目相机、双目相机、毫米波雷达、激光雷达等,这就会涉及到传感器的融合了。其实传感器融合是一个非常传统的科研方向。早期的时候都叫数据融合,但随着科研领域流行词汇的改变,现在更多的称为多模态融合。

其实学习人工智能并不难,想要实现前面提到的目标检测任务,其实只需要十几行代码。元宇宙是未来下一代互联网,是人类未来的数字化生存。元宇宙是一系列技术的“连点成线”,能够带来超越想象的潜力,驱动产品创新和商业模式创新。终极的元宇宙将包含:互联网、物联网、AR / VR、3D 图形渲染、AI 人工智能、高性能计算、云计算等技术,具有改变世界的潜力。如果对元宇宙感兴趣,而又不知道从哪入门,那么从 AI 这个大家公认与元宇宙最相近的方向开始学习是很好的选择。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352