最近的一段时间,算是比较忙碌,且不说网络上流行的996,我曾经自己调侃,这一个多月来,自己很多时间都已经886了。
这个月当中,真是经历了各种压力、各种问题。也有朋友问我,选择这样的方式,究竟是为了什么?这个答案可能要在一两年以后才方便回答呀!
今天的这个题目,源自一个老朋友的提问,这个朋友虽然后来表示“听懂了”,我是清楚的,距离真正的“听懂了”,还有很长的时间要度过。
恰巧的是,在工作中,在业务讨论的环节中,我们经常会听到与这个老朋友提出的问题相类似的问题,并且,这种问题贯穿了某些人的一生,且不曾被丝毫澄清过。
而,今天这个老朋友问我的问题,我也很难一句两句说得明白。并且,在不着边际地进行描述后。可能,让许多人看来,就是胡扯!
这个胡扯,并不是我的错,也不是我所引用的内容,是不科学的。而是,用一两千字,就能把复杂的思路,严谨记录下来,我只见过老子的《道德经》。在这个丰碑级别的作品,这个伟大的智者面前,我的这点灰尘,就算是被认定为胡扯,也一点也不冤枉呀!
好了,下面就来说说,究竟是个什么样的问题?
朋友:猪猪侠!出来!说说这个基因工程是不是真的很危险?!
——我的朋友喜好叫我猪猪侠。
我:你又看微信公众号的文章了吧?告诉你微信、微信,就是要微微相信,切莫动了心思……
朋友:不行,你必须给我说道说道……
禁不住这家伙的死缠不放,我就给他扯了一下,这一扯,且不得了,直接要点评:基因工程和人工智能,这两个可能被认为是二十一世纪最重要的科技领域。
而且,当今天晚上,我打算把这一段对话整理记录下来的时候,添加进来的内容,恐怕要达到“头脑是不是坏掉了”的地步。
我先抛开“基因工程”不谈,谈一谈我对这个世界的宏观认识。
对于本篇短文,我可能会多次用到“自然”这个词,这个词如何去理解,如果各位有空的话,可以去参考《认识时间》。如果觉得太过玄乎,那么你可以认为:他代表了一切你已知的和未知的存在。可能和某些人所认为的“宇宙”很类似。“包罗万象”。
我认为,在自然中,有几个互相独立的维度,他们互相独立,存在影响却不关联。
第一个维度,{能量,质量}对,这一对欢喜冤家,在人类没有研究量子力学之前,或者说,在爱因斯坦没有提出相对论之前,没有人把他们的关系想得那么密切。当然,最终变成“亲密的一对”,我认为还是哥本哈根学派的那帮家伙参悟和理解得更加准确。至于这“亲密的一对”究竟有多少“鲜为人知”的内幕,有兴趣的小伙伴们可以翻阅相关资料细细品味。
第二个维度,{生物信息,基因}对,在人类的“终极问题”中,总有一个问题,就是“我从哪里来、我到哪里去、我要干什么?”,在当今科学背景下,人类发现了DNA、RNA的转录过程,并且在解开RNA的转录机制后,提出了“遗传密码”的框架,认为许多DNA或RNA片段,是肩负“遗传”这个伟大的任务的关键角色。
第三个维度,{认知,神经信号}对,这是所有具备神经活动,甚至广泛到具备“电信号”活动的系统所具备的维度。就是人类的大脑所表现出的神经信号与人类的智慧之间的关系。
这三个对,基本上是以{信息,表现}的形式组成。
在{能量,质量}对中,随着人类对质量的起源的探索,逐步意识到,质量很可能是能量的一种表现形式,是能量的一种固化、可视化。并且,质量牵制了能量在“时空”这个媒介中的移动,质量表现得越清晰的能量体,其在时空中的牵扯与固化越多。改变他在“时空”中的相对位置(就是让他变化运动状态)就越难。而,“轻”得几乎没有质量的“光”、“电子”,都却轻松滴以光速运动,而且是不断变化方向的运动。
在{生物信息,基因}对中,生物信息,是一种“信息或故事”,通过基因的方式传播,(暂且不说,是不是还有基因以外的方式),这种传播,统称为“遗传”。不仅仅有物种的可见生物信息,还有性格、脾气、爱好、智慧等无形信息。
在{认知,神经信号}对中,表述的是,智慧生物,通过“电”这个物理现象,却能传递和承载大量的“信息”。而我就把这些“信息”称为“认知”,至于如何去理解这种“认知”与“电信号”之间纠缠不清的关系,可以参考《人类认知的基本原则和数学模型》
今天,朋友所问的“基因工程”,就主要与{生物信息,基因}这一对有关。
曾经的历史上,有过人把人类基因普,比喻成为:“记载人类遗传信息的’天书’”。
这篇“天书”的主要结构,是DNA,组成DNA的主要结构是四种脱氧核苷酸(dAMP、dTMP、dCMP、dGMP)。
类比到我们所熟悉的环境中:
一个细胞核内的所有染色体,就是一套记录个人信息的“书”。
每一条染色体,就是一本自成体系的“书”。
而这本书的文档类型不是Word、不是Excel,是DNA。
这本书中的字,由四个笔画横竖撇捺(dAMP、dTMP、dCMP、dGMP)。
人类发现了一些,可以修改DNA片段的方法,就是类似我们在操作Word的复制、粘贴。
就像每个汉字的笔画可能繁简不等,DNA中的每一个基本信息元素所需要的脱氧核苷酸的数量也可能不一。能够像分解出汉字一样分解成每一个有效的DNA片段,以及如何将这些片段加入到另外一段DNA链中,就是基因工程研究的内容。
人们发现,无目的地操作DNA片段,是没有意义的,要想有目的地进行DNA片段的操作,并且达到“安全、有效”的目的,就必须理解或翻译DNA的“信息”。
这个时候,开头提到的“人工智能”,尤其是人工智能中,利用统计学原理进行“语音识别”的程序,就被借鉴到了基因工程。
在人工智能软件领域中,我们都知道,随着统计学算法介入到“语音识别”、“计算机翻译”领域。语音识别和机器翻译的正确率有了惊人的进步。而且,所有的人工智能程序猿都知道,人工智能的语音识别和机器翻译程序,并不能“理解”他所识别的语音和所需要翻译的内容。但却可以将以声波为载体的信息转化为文字,或者将一种文字转化为另外一种文字。
这种突破信息承载媒介、信息承载形式的“翻译”能力,让基因工程领域的科学家异常兴奋。这样的话,他们也可以将以DNA为媒介、以脱氧核苷酸形式所记录的“遗传天书”“翻译”成人类语言。
所以,你会看到,今天的大数据应用领域,常常看到“基因工程”。
这种应用,却是非常可怕的。尽管说,大数据的应用,使人类掌握DNA变化规律的能力有所提高。但是,这种能力的提高,却与是否能够正确翻译DNA毫无关系。
我们在互联网上,很容易找到两篇字数相近、语言风格相近,但是却风马牛不相及,甚至信息含义中完全不同的两篇文章。如果典型地举例的话,就像下面的两行文字,几乎用词一样、风格一样,但观点却不一样。
“我认为基因工程和人工智能,会让人类变得更加强壮”
“我认为基因工程和人工智能,会让人类变的更加虚弱”
我们也都知道,一篇文章中,信息的表达,并不是想象得那么“平等”,往往存在着:标题、小节、关键点,等等关键信息点。
对于不理解这种信息结构的观察者来说,是完全不知道这种结构的区别的。是无法理解这种结构的使用规律的。
也正是因为这种复杂结构的存在,并且这种复杂结构的关联规律的存在。所以才有:人的基因与猪的基因相似度83%,人的基因和大猩猩的基因相似度99%,大猩猩的基因与猪的基因相似度82%。因为你不能运用基因的结构、基因的结构组合规律进行对比,就像仅仅对比两篇文章的字数、字频,能猜测出两篇文章分别在说什么的比率并不高。这也是为什么99%相似的人和大猩猩的基因,却写的是两个完全不一样的生物。
当我们,乐观地认为,采用统计学所分析出的“基因”原理,是我们已经能够掌握和控制的时候,殊不知其中可能存在大量的“未知”风险。
因为,统计学是一个基于“样本”的学科。在写就“基因天书”的作者笔下,掌握着一种写作规律。我们所生活的这个花花世界,是依据这个写作规律所创造出来的。而我们的“样本”仅仅是“正例”样本。虽然,各种基因差异、各种生物多样性,远远超出我们的想象。
但,我们仍然不知道,基因工程中,对基因片段的重组,是否是一个毁灭性的行为,因为,这种毁灭性的行为,在DNA诞生的几千万年之后,已经在半路上都消失了,从我们的现有世界中消失了。
虽然,目前有很多人争论,转基因食品,并不可能通过“吃”的方式影响到人类的健康。例如:人类吃了这么多年的大米,但是大米却并不能变成人的一部分。
但是,在了解人类尝试理解DNA的过程,就像一大群猴子,希望通过不断抄袭《莎士比亚》而“读懂”人类的语言一样。在了解人类尝试操作DNA的过程,由于没有能力将DNA翻译成可以理解的丰富含义的“文档”,就像在不断地抽出楼房的砖块,却并不能知道是不是抽掉手里的这一块就塌楼一样的无知。
你就应该不得不担心,千万不要让基因工程激进,并且,不要轻易认可一个基因操作。
2017年5月15日
连云港
Wollaston