健康是人类文明发展中始终不懈的追求。随着社会生产力的不断提高,衣食住行不再是生活的瓶颈,人们越来越重视生命的长度和质量。创办苹果公司的乔布斯(Steve Jobs)在他生命的终点反思:“世界上最贵的床是什么?是病床。人们终要认真阅读的,是健康生活之书。”如何大幅延长人类寿命,提高生命质量,让每个人都能充分享有全方位全生命周期的健康保障,不仅是每个人自己的事,也是重要的公共服务和公共政策议题。
建国初期我国人口平均寿命为男性39岁,女性42岁。进入上世纪60和70年代,中国大力推动多种医疗技术快速应用,中国人均预期寿命迅速提高,平均每年增加2.54岁。80年代至今,在各种医疗技术逐渐渗透应用下,中国人均预期寿命每年增加0.31岁,人均健康寿命增加0.26岁[1]。此外,部分发达国家如美国、英国、法国、日本等国家,2000年后出生的人均预期寿命已超过100岁[2]。健康长寿正在变成全民可及的公共品。
生命第一性原理与工具
追求健康、乐享人生,需要人类对生命有根本性认知。在农业时代,人们被迷信与无知所绑架,炼丹求长生不老,观音恩赐送子,是将生命寄托于神仙;在工业时代,临床上盲目进行了大量胃次全切除手术,是因为缺乏对胃溃疡与幽门螺旋杆菌感染之间因果关系的认知[3]。生命中心法则是生命科学的第一性原理,即遗传信息由DNA传递给蛋白质,DNA是生命之根本。脱离生命科学“第一性原理”来追求健康,注定终结于命运的无力与无奈。
对生命的认知与对物质世界的认知一样,都必须依靠新工具,观察新现象,获得新知识,形成新理论,最终达成新共识与新实践。在认知物质世界的过程中,人类以还原论思想为指引,借助新工具来观察现象,逼近无穷大与无穷小的各个尺度,揭示客观规律。电子显微镜让人类观察纳米级别(10-9米)分子三维结构[4];强子对撞机让人类得以探索新的粒子,管窥原子核内的奥秘(10-15米)[1]。借助射电望远镜,人类发现了脉冲星、类星体、宇宙微波背景辐射与星际有机分子;借助引力波探测器和一系列望远镜的协同,人类观测到中子星的合并,能够探索宇宙和物质的起源。人类归纳出了元素周期表、万有引力定律、相对论和标准粒子模型等一系列适合各个尺度的科学规律,对客观现象不断观察统计并且系统化、理论化。人类面对物质世界的一次又一次胜利,为认识生命这个复杂的系统带来的重要的启示:新工具,特别是颠覆性的技术工具对于人类认识世界起决定性作用。
生命是什么?自文明诞生起,人类就对这些问题进行着不断的思考。随着工具的不断演进,人类认知生命的尺度也从米、厘米,推进到微米、纳米。人类借助肉眼观察,以朴素的整体论与建立在可重复性试验上的还原论,开启了近代医学。中国《黄帝内经》对人体内脏的部位、大小及功能已有一定认识[5]。公元前460-公元前370年,古希腊“医学之父”希波克拉底等建立“体液说”,外界因素导致体液的不平衡,从而引起疾病。公元129-200年,古罗马医生盖伦通过动物解剖实验论述了人体各部位的作用,他建立的医学理论支配了欧洲之后一千多年的医学发展[6]。公元1543年比利时医学家维萨里的著作《人体结构》问世,创立近代人体解剖学。公元1628年,英国解剖学家哈维在划时代的《心血运动论》中,建立血液循环理论[7]。在经历了两千多年的漫长探索后,人类对生命的认知终于进入到以解剖学为基础的近代医学阶段。
认知生命也同样遵循工具决定论,工具的革新带来了对生命认知在尺度上的跨越与观念上的突破。借助显微镜这一颠覆性工具,人类探寻到了生命的最小单元——细胞。公元1665年,英国物理学家罗伯特胡克在显微镜下观察软木切片,发现蜂窝状小室,将其命名为为“Cell”,这便是细胞一词的历史由来[8]。1675年,荷兰人列文虎克手工磨制出超越时代的显微镜,直接观察到了微生物与人精子细胞[9]。1838-1839年,德国植物学家施莱登和动物学家施旺先后分别发表《植物发生论》、《动植物结构和生长一致性的显微研究》等论著,正式建立了细胞学说[10]。
科学的发展绝不是一帆风顺的,从显微镜发现微生物到传感染理论和实践的建立,经历了300年的艰难曲折。新的认知突破首先需要面对长时间的质疑。直到1847年人们仍然认为感染疾病是由于体液不平衡导致的,而不是显微镜下那些形状奇特的微生物。但随着时间推移,新发现新认知终将形成新的理论与实践:1862年路易·巴斯德提出“一切生物来自生物”理论,创建了巴氏灭菌法,发明了狂犬疫苗,开启了预防医学的新时代;1890年科赫提出“科赫法则”,确定病原与疾病的因果关系[11];1956年汤飞凡自我接种分离后的沙眼衣原体,再现红眼病[12];1984年巴里·马歇尔服用了分离后的幽门螺旋杆菌,证实胃溃疡的成因[13]。
DNA双螺旋的伟大发现是颠覆性工具应用带来重大科学突破的典范。1869年瑞士医生米歇尔分离出了继蛋白质、脂肪与糖之后的第四大细胞分子类型——“核素”[14]。1944年物理学家薛定谔发表《生命是什么》,提出遗传物质应是“非周期性晶体”(Aperiodic Crystal),通过不同的序列“拼装”出千姿百态的生命世界,出现生命现象。由非周期性晶体构建的生命体,千姿百态,生命体吸收外界的“负熵”(热力学概念)维持生命活动、遗传、进化,这是最早关于生命遗传密码的描述[15]。借助X光衍射工具的应用,沃森(James D. Watson)和克里克(FrancisCrick)于1953年在纳米尺度精确描述出了“核素”的双螺旋分子结构,终结了关于遗传物质是蛋白质还是核素的历史争论,并将生命的遗传密码命名为DNA(脱氧核糖核酸)[16]。生命是简单规则的超大规模演绎,作为生命源代码的DNA只由A、T、C、G四种碱基构成,这四种碱基形成A-T、C-G的固定搭配形式,形成碱基对,并在空间中排列成双螺旋结构,DNA上碱基对的排列顺序(基因组)就决定了建造身体的十几万种蛋白质,并负责这些蛋白质的调控,因此DNA决定了生命的生老病死。
因此生命不仅有物质结构,还有更重要的信息结构。大千世界的生老病死与万物生长都受控于生命的遗传密码DNA序列,结构决定功能,信息结构(基因型)决定着千变万化的生命现象(表现型)。DNA双螺旋结构发现之后不久,遗传信息从DNA到RNA的转录过程和从RNA到蛋白质的转译过程被发现,生命科学的第一性原理——生命中心法则由此确立[17]。这是二十世纪最伟大的发现之一,极大拓展了人类对生命的认知,为人类带来了掌控自身的希望。
人类基因组计划与数据
70年代以来,DNA测序相关技术开始出现并快速完善,新技术工具使得通过测序人类基因组来整体认知生命成为可能。DNA双螺旋的发现开创了分子生物学的新纪元,科学家们围绕生命的第一性原理广泛展开了机制研究。一批小研究团队由个人兴趣出发,通过假说-演绎法与合理的实验体系设计来进行科学探索,这种“盲人摸象”式的探索历程,是科学史上还原论思维的极致展现。在早期阶段推动了分子生物学的飞速发展。
人类基因组有三十亿对碱基,探索“天书”的奥秘必须从基本的“读”(即DNA测序)入手,需要科学界和产业界的结合,需要大量科研仪器和大平台的配合。面对基因组带来的“数据洪流”,一些科学家认识到,除了以小团队开展兴趣导向的研究模式之外,生命科学还需要大科学计划主导、大平台支撑的科研模式。1987年,美国国家科学院、工程院、和医学院牵头发布了《图解与测定人类基因组序列》计划报告,确定了人类基因组计划(theHuman Genome Project)的规定时间、规定预算与规定目标,人类基因组计划应运而生。这项计划自1990年以来,共耗资38亿美元,通过美国、英国、日本、法国、德国和中国六国科学家的合作,2000年6月26日,美国总统克林顿与英国首相布莱尔共同宣布人类基因组计划工作草图完成。“人类基因组序列是全人类的共同财富,应该用来为全人类造福。”
人类基因组计划展现的是对生命整体认知的系统论思维,与曼哈顿原子弹计划、阿波罗登月计划一样,这项围绕第一性原理解读生命的国际大科学计划,把人类在生命科学领域的探索,从之前个人兴趣导向的零星的科技创新模式,转变为国家意志支撑技术平台和体系建设,进行有明确目标、大规模集中式攻坚的创新科技模式,这种模式依赖于技术变革、政治决心、规模投入与团队力量。人类基因组计划的成功,为大科学计划的国际合作树立了典范[18]。
人类基因组计划让人类第一次完整地认识到自己的遗传结构。人类基因组计划揭示了30亿对碱基所构成的生命密码,奠定了基因组学的基础,生命科技的发展由此迎来了转折点。人类基因组计划在科学上的系统性、理论性、与实用性,为今后的大科学计划与工程树立了标杆,它的传奇还在以惊人的速度延续,一系列围绕人类基因组的国际大科学计划相继展开。从人类基因组带来的“一个人”的基因组学大数据,到2005年,人类基因组单体型“HapMap”计划测量了269个人群基因组,首次揭示了“人和人”的不一样,即人群个体间的DNA序列差异[19];2008年完成了首个黄种人的全基因组测序计划——“炎黄一号”计划[20];2012年国际“千人”基因组计划完成了全球范围内不同人种间,共计2504个人的全基因组,形成了详尽的人类遗传变异目录,为探索基因与人的生老病死之间的复杂联系奠定了基础[21]。
当代天文学是典型的以大科学计划、大规模数据驱动的科学。美国哈勃太空望远镜、中国500米直径天眼射电望远镜-FAST(Five-hundred-meter Aperture Spherical radio Telescope)、美国激光干涉引力波探测装置-LIGO(LaserInterferometer Gravitational wave Observatory)等都是由大科学计划而诞生的大科学装置,能从微波、可见光、X射线等各个电磁波波段、以及全新的引力波维度,以“多信使”的方式探索宇宙,天文学已经成为数据密集型科学,其所获取的宇宙大数据的存储容量需求通常达到10PB以上(注:1PB=1024TB)[22]。宇宙大数据的采集、存储、管理、分析和可视化已成为天文学研究的新模式,是继实验科学、理论科学、计算科学之后的第四种科学发现的模式,科学大数据已经成为驱动新的科学发现的基础支撑和动力引擎。生命系统是运行在空间、时间、能量与质量的广阔尺度上的复杂系统。在质量规模上,生命从遗传物质分子到生态系统共跨越了30个数量级(1030),跨度大大超越了天文学中地球与银河系之间18个数量级的质量比例(1018)[23]。
人类认知自身这样一个复杂的生命系统,也可借鉴当代天文学的发展模式,以大科学计划的组织动员方式,获取组学大数据,带动新的科学发现与产业发展。组学数据,作为生命健康的基线,既是科研大数据,又是产业大数据。全球基因组学大数据正在以每7个月翻1倍的超摩尔定律速度飞速增长。在这样的趋势下,预计到2025年,超过一亿人的基因组将被测序,基因组学数据量将达到2-40ZB/年,组学产生的数据规模将超过其他的大数据领域(天文学:1 EB/年;Twitter:1-17 PB/年;YouTube:1-2EB/年)[24]。
精准医学是人类基因组计划的必然延伸。美国健康卫生研究所(National Institutes ofHealth)所长考林斯(Francis S. Collins)提出了“从基因组结构到基因组生物学,再到疾病生物学与医学科学”的总路线图,旨在将人类基因组计划的成果转化到临床与社会效益上,构建国际疾病分类新标准,从而实现精准医学。目前各国都在积极组织基于大人群大数据的精准医学大科学计划。2006年启动的美国癌症基因组图谱(The Cancer Genome Atlas)计划,完成了11000例病人33种癌症的完整的、多维的图谱,对肿瘤在人体中如何产生和发展提供了全面而又深入的基础数据,在临床上摆脱了根据肿瘤的原发部位进行肿瘤分类的传统方法,实现了根据特定的基因组改变和/或分子标记对肿瘤亚型进行精准鉴别[25]。2012年启动的英国“Genomics England”计划将测量10万个患者的全基因组,重点关注罕见疾病、常见癌症与传染病,为英国奠定领先的基因组医学基础。2015年启动的美国精准医学“All of US”计划正在招募100万以上的志愿者,旨在通过建立健康数据库,促进精确预防与医疗的发展。
在不远的未来,组学数据将确定每个人的健康基线,全景式生命数据将能够实时监测每个人的自身与外来基因的变异状况。目前的精准医学实践中,对于因果关系明确的疾病,例如传感染疾病等,可以通过具有临床意义的有限基因位点来实现疾病的预测、预警与预判;对于因果关系不明确的复杂疾病,例如肿瘤与心脑血管疾病等,就需要通过具有潜在临床意义的大人群大数据,来探索无限变化的疾病的真实世界。因此用全景式生命数据确定每个人的健康基线就显得格外重要。确定健康基线需要从基因组、蛋白质、影像学等多个维度记录人的生命状态,辨别疾病需要全方位描述生命与内外环境相互作用。因此,需要对基因组、基因组的表达产物RNA与蛋白质组进行基线和动态的测量,同时对组织与器官的影像,也需要收集大数据确定基线,以便在生命周期中不断与基线比较。只有贯穿基因、蛋白质、影像学、全生命周期四个维度的生命数据,才能预测DNA变化带来的健康风险,实现真正意义上的精准医学。
中国将为健康这一人类终极目标给出中国答案。作为人类历史迄今唯一从未中断的文明,中国在过去2000年的时间里都处在领先地位,然而,在最近200年的时间里错过了工业革命,在过去50年的时间里险些错过信息革命。今天,人类发展走到了从物质追求转向生命追求,从服从自然选择到掌控生老病死的关键转折点,中国将有机会在这个节点实现文明的弯道超车,成为人类进入生命时代的策源地和引领者。
参考文献
1. Virdee, T.S.,Beyond the standard model of particle physics.Philos Trans A Math Phys Eng Sci, 2016.374(2075).
2. Christensen,K., et al.,Ageing populations: the challenges ahead.Lancet, 2009.374(9696):p. 1196-208.
3. Morey,D.A. and K. Plummer,Complications following subtotal gastrectomy for peptic ulcer.Ann Intern Med, 1955.43(5): p. 1067-75.
4. Harris,J.R.,Transmission electron microscopy in molecular structural biology: A historical survey.Arch Biochem Biophys,2015.581: p. 3-18.
5. Gao,Y.T., H.W. Pan, and S.B. Wu, conception of anatomical structure of zang-fu viscera in Huangdi Neijing].Zhong Xi Yi Jie He Xue Bao, 2006.4(4):p. 339-42.
6. Toledo-Pereyra,L.H.,Claudius Galenus of Pergamum: surgeon of gladiators. Father of experimental physiology.J Invest Surg,2002.15(6): p. 299-301.
7. Sakai,T.,Historical evolution of anatomical terminology from ancient to modern.Anat Sci Int, 2007.82(2): p. 65-81.
8. Lawson,I.,Crafting the Microworld: How Robert Hooke Constructed Knowledge About Small Things.Notes Rec R Soc Lond, 2016.70(1): p. 23-44.
9. Wollman,A.J., et al.,From Animaculum to single molecules: 300 years of the light microscope.Open Biol, 2015.5(4): p. 150019.
10. Ribatti,D.,An historical note on the cell theory.Exp Cell Res, 2018.364(1):p. 1-4.
11. Baxter,A.G.,Louis Pasteur's beer of revenge.Nat Rev Immunol, 2001.1(3): p.229-32.
12. Wang,N., S. Deng, and L. Tian,A review of trachoma history in China: research, prevention, and control.Sci ChinaLife Sci, 2016.59(6): p. 541-7.
13. Marshall,B.J.,One Hundred Years of Discovery and Rediscovery of Helicobacter pylori and Its Association with Peptic Ulcer Disease, inHelicobacter pylori: Physiology and Genetics, H.L.T. Mobley, G.L. Mendz, and S.L. Hazell,Editors. 2001, ASM Press.
14. Dahm,R.,Discovering DNA: Friedrich Miescher and the early years of nucleic acid research.Hum Genet, 2008.122(6): p. 565-81.
15. Weber,B.H.,What is life? Defining life in the context of emergent complexity.Orig Life Evol Biosph. , 2011 Feb.41(101).
16. Watson,J.D. and F.H. Crick,Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.Nature, 1953.171(8).
17. Crick,F.,Central dogma of molecular biology.Nature, 1970.227(5258): p. 561-3.
18. Green,E.D., J.D. Watson, and F.S. Collins,Human Genome Project: Twenty-five years of big biology.Nature, 2015.526(7571): p. 29-31.
19. InternationalHapMap, C.,A haplotype map of the human genome.Nature, 2005.437(7063):p. 1299-320.
20. Wang,J., et al.,The diploid genome sequence of an Asian individual.Nature, 2008.456(7218):p. 60-5.
21. GenomesProject, C., et al.,A global reference for human genetic variation.Nature, 2015.526(7571): p. 68-74.
22. Livio,M.,Astronomy: Hubble's legacy.Nature, 2015.520(7547): p. 287-9.
23. West,G. and张培,规模 复杂世界的简单法则. 2018:中信出版社.
24. Stephens,Z.D., et al.,Big Data: Astronomical or Genomical? PLoS Biol, 2015.13(7):p. e1002195.
25. Hutter,C. and J.C. Zenklusen,The Cancer Genome Atlas: Creating Lasting Value beyond Its Data.Cell, 2018.173(2): p. 283-285.