几个概念
结构化数据和非结构化数据
按结构,数据可以划分为两类:结构化数据和非结构化数据。
结构化数据是指存储在数据库当中、有统一结构和格式的数据,这种数据,比较容易分析和处理。非结构化数据是指无法用数字或统一的结构来表示的信息,包括各种文档、图像、音频和视频等,这种数据,没有统一的大小和格式,给分析和挖掘带来了更大的挑战。
从结构化数据到非结构化数据的推进,也代表着可供挖掘的数据在大幅增加。
最小数据集
在美国联邦政府的发展历史上,业务数据的收集,有一个重要的里程碑,这就是“最小数据集”。
最小数据集是指通过收集最少的数据,最好地掌握一个研究对象所具有的特点或一件事情、一份工作所处的状态,其核心是针对被观察的对象建立一套精简实用的数据指标。
普适计算
通过在日常环境中广泛部署微小的计算设备,人们能够在任何时间和任何地点获取并处理信息,计算将最终和环境融为一体。这就是普适计算,是人类的第三波计算浪潮。
一句话:万事万物,凡存在,皆联网,凡联网,皆计算。
无处不在的微小计算设备和无处不在的互联网相结合,实现无处不在的信息自动采集、传递和计算。
这种微小的计算设备,就是传感器。近年来流行的物联网概念就是普适计算的最佳例子。
数据挖掘
数据挖掘是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。
之所以称之为“挖掘”,是比喻在海量数据中寻找知识,就像开矿掘金一样困难。
从数据到知识、从知识到行动
如何收集、管理和分析数据正在日渐成为我们网络信息技术研究的重中之重。以机器学习、数据挖掘为基础的高级数据分析技术,将促进从数据到知识的转化、从知识到行动的跨越。
关于妥协和交换、分权和制衡的制度
所有的政府,都是建立在妥协和交换的基础之上。事实上,人类所有的收益和快乐、所有的美德、所有明智的行为无不如此。
——埃德蒙·伯克(1729-1797),英国政治学家
那么,为什么必须妥协?其背后交换的原则又是什么?
几乎和伯克同时,经济学的鼻祖亚当·斯密在其经典著作《国富论》中提出了“理性经济人”的假设。他主张,人都是利己的,在面临两种以上选择时,总会选择对自己更有利的方案,争取最大的经济利益。
1943年,美国心理学家马斯洛提出了人类的需求层次理论,对人类如何做出妥协和交换作出了更细致的解释。马斯洛把人类的需求划分为生理、安全、社交、尊重和自我实现五大类,这五大类需求如阶梯一样从低到高展开,低层次的需求相对满足了,更高层次的需求就会成为个人行为的主导。在人生的不同阶段和境况,会有不同的“主导需求”。最高层次的需求,是“自我实现”。所谓的“自我实现”,又分为“名利、成就、道德、真理”等等,其中,个人对名利和成就的追求又占了主导。
一切的妥协和交换,都是围绕个人的“主导需求”发生的。但恰恰在所有能成为“主导需求”的因素当中,道德是最为薄弱的,很难成为一个人行为的“主导”。
福特、约翰逊、莫耶斯和拉姆斯菲尔德的变化,就是因为人的位置变了,即使内心的道德判断还是一样,但利益结构变了,主导需求也变了,所以行为和选择也就变了。
人,绝不是天使。任何人的历史,都是一部道德、理性与私欲的斗争史;这种斗争,此起彼伏,至死方休。精英也好,领袖也罢,其实都是凡人,很多时候,都无法战胜自己的私心和欲望,需要外力的制约和推动。
约翰逊、福特就是典型的例子。即使明知信息自由是历史的进步,也拒绝签署。
但我们看到,虽然贵为总统,他们在信息自由的大潮面前,也没能成为阻挡历史进步的决定性因素。在外力的制约下,他们被迫妥协。这个外力,就是分权和制衡的制度。
信息丰富与注意力的匮乏
信息消费了什么是很明显的:它消费的是信息接受者的注意力。信息越丰富,就会导致注意力越匮乏……信息并不匮乏,匮乏的是我们处理信息的能力。我们有限的注意力是组织活动的主要瓶颈。
我的点评
1.普适计算——物联网毋庸置疑是未来的趋势,包括物联网在家庭的应用,即智能家居;物联网在城市化中的应用;物联网在空气质量、海洋监测方面的应用;甚至可穿戴设备、各种监控个人身体健康数据的仪器也属于此范畴。这些将极大地优化人类的生活方式
2.人总有一些内在的本性,是我们无法回避的。比如说懒惰,比如说嫉妒,比如说只关注眼前的得失与利益。我们可以通过升级自己的大脑操作系统来更好地控制,但是永远也无法消除。所以“人有一部分本性是不那么好”的假设,应该是我们规划 一个团队或者组织 基本制度的一个重要前提,因为这本来就是现实的一部分。认清现实,能更好地解决问题。
3.在这个注意力极其匮乏的时代,筛选重要的、有价值的信息是一种能力,利用这些信息帮助自己或他人成长是一种能力,能够聚焦自己注意力更是一种最重要的元能力!