第75篇 外行人如何理解数据

我们现在对数据有很多种分类方法,比如交易数据、位置数据、医疗数据、消费数据等等。这种分类方法往往是不妥当的。

所有的数据都有价值。数据就像乐高积木一样,就这点材料,随意组装,都能组成看上去完全不同的形状。

比如说交易数据、位置数据、医疗数据、消费数据,这几个分类其实就不是互相排斥的,里面还有互相包含的关系。

我们对分类要有一个动态的全面的认识

我们从数据的颗粒度和敏感度来想想什么数据最有用。

颗粒度

比如一个国家的GDP是1万亿美金,和一个国家的人均GDP是1万美金,人口是1亿,显然是后者更好。后者可以反推前者,但只有前者推不出后者。所以颗粒度越细的数据越有用。当然在数据处理和颗粒度之间还要有一个平衡,否则颗粒度过细,数据量太大,处理起来会很痛苦。

社会是个人组成的,所以一般来说,颗粒度具体到个人就已经很好了。

敏感度

社会文明的一个标志是对个人隐私的尊重。所以在数据保护中,个人隐私是需要绝对尊重的,有些底线是不能触碰的。这就决定了关于个人的很多状态是敏感的

比如,个人信息,包括身体状况、财务状况,这些都非常敏感。另外在西方文化中,冒然去问别人的年龄、身高、体重都是不礼貌的。

再想下去,要 更好地观察经济状况,什么数据最有用呢?经济是人的活动,所以,人的活动密度是个非常直接的指标,可以观察出很多经济的细节。比如人的地理位置是不需要和个人ID挂上钩的,所以只需要看到整体就可以得到很多有趣的结论了。

所以怎么从数据里面挖掘出经济活动的细节,这是一个很有意思的方向。从目前的感觉来看,比如地理位置的数据会很有应用前景,是一个含金量很高的数据。(这让我想到了各大手机厂商的天然优势地位)

以后加密技术发展到一定规模以后,尤其是可以在本地来进行加密的话,个人数据的使用可能会变得非常地便利和快捷

什么数据含金量最高,这可能是一个动态演化的过程。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,177评论 2 89
  • 真不知道写些啥在打牌算了吧
    5b36e94088c0阅读 1,130评论 0 0
  • 一 前言 PipelineDB在1.0之后,正式改成了Postgresql的一个插件,我们可以在一个pg中做一些有...
    遥想公瑾当年阅读 7,085评论 1 3
  • 呵 成年人的世界,残酷而简单 大家都在学习的时候比有钱比颜值,大家都该出来混社会的时候比实力比成绩,实在风平浪静无...
    笔好阅读 1,369评论 0 0

友情链接更多精彩内容