上一篇:基于互联的大数据 之三——大数据的强大威力
整合多方面数据以得出结论,这并非现代人的专利,医学早就在应用相关思路,中医的辨证论治就是要整合诸元以做出决断;西方也是这样,西医鼻祖希波克拉底就不断提醒人们要结合诸元思考。
在现代西医起步以前,一个叫福代斯的医生做了极为诚恳的工作,为搞清楚疾病的来龙去脉,他制作了一张复杂的坐标图,在横坐标上,有表示气候、季节、流行病、病人气质、特异反应、患病体型、年龄以及既往偶发症状的各种记号,在纵坐标上,他根据症状出现的器官或机能(脉搏、皮肤、体温、肌肉、眼睛、舌头、嘴巴、呼吸、胃、肠、尿)对症状进行分类,这是复杂的计划,那个时代的计算能力有限,靠一张白纸就想得出结论还不太现实,他却是具备大数据思维的人。
现代西医发展后,类似思路被广为应用,Meta分析就是全面收集所有相关研究并逐个进行严格评价和分析,再对资料进行统计学处理以得出综合性结论,其中的大数据思维非常浓郁。只不过,现代西医发展了很多指标,也抛弃了古代的大部分思路,转向追求精密和微小。
西医会热情地迎接大数据,这是技术环境提供的可能性,各式各样的生物检测工具出现了,它们贡献了大量生命特征,基因组、蛋白质组、糖组、代谢组、微生物组,每个组学都是海量数据,据分析,每14个月,基因研究产生的数据就会翻一番。
计算机带来了强大的运算能力,计算生物学、系统生物学、生物信息学等应运而生。这样,美国人提出名为“精准医学”的医学新计划,希望“引领一个医学新时代”,这是各种研究的整合升级版本,是典型的大数据应用。负责此项目的领导人提出:“我们准备建立一个有一定时间跨度的、100万人以上的美国人群‘队列’,他们自愿参加该项研究。参加者被要求同意对其进行全面地生物学分析(包括细胞种类、蛋白质、代谢分子、RNA和DNA,当经费允许时可进行全基因组测序)和行为分析,所有这些分析数据都将连接到他们的电子健康档案”。如此就可形成“一个大型的、多层级的、充分整合的人类疾病知识数据库”。在这样的数据库里,“关于人类疾病的知识不仅包含了临床诊断和病理分析等表型信息,还具有各种生物分子信息,包括基因组、转录组、蛋白质组、代谢组、脂质组和表观遗传组等。”2014年6月,欧盟委员会发布了《CASyM路线图》,这是欧洲版的“精准医学”。
大数据方法也广受药企的青睐,药物开发到了成熟期,难度在加大,要整合各方面的数据:生理病理的知识、发生在实验室的数据、药物化学和其他相关专业领域的知识、临床医学资料,以提升新药研发的效率。每一类数据都极为庞杂,所以药学开发的大数据更为庞大。
人们通常认为,此类计划就是典型的医学大数据。所以,从互联网角度讨论医学大数据,会被人们嘲笑。反驳者或许认为,聪明的大脑早已深思熟虑,一切可能的方案都被仔细打量过,其他思路往往是外行的想当然,并没有多少可行性,也无多少必要。