1.假如你的电脑上有两张狗狗的照片,一张像素高,一张像素低,如果要看一个整体的轮廓,那么这两张图片的区别并不大,你可以清除地判断出这是一只狗,可是如果你真想看看这只狗的眼睛什么颜色,皮毛、表情等这些很细致的东西,你会用放大镜放大,这样就可以看的清清楚楚,如果用像素低的照片则会越放大越模糊。这张清晰的图片就是大数据,而那个看起来模糊的就是抽样数据。这是大数据的第一个特点样本量大。
2.数据不是数字,文字是数据、方位是数据、沟通是数据、世间万物都是数据,数据化的核心是量化一切。
3.是维度特别大,一个城市的市长要搞GDP造假,但是用电量他就很难造假啊!如果再加上什么海关的进出口数据啊,大宗消费品的销售增长啊等等,那数据造假就不难识破
4. 预测是大数据的核心,通过研究相关性,而不是因果关系。如通过大数据发现,啤酒的销量和纸尿裤的销量成正相关,于是会捆绑促销或者把这两组产品放在相邻的货架上,而不必去问为什么。这种方法准确、快捷而且不易受偏见影像。
5.数据产业链分为三种,一种是采集数据,第二种是数据的分析,第三种是从数据的分析中找到创新和机会。
7.对将来的判断,专家相对消亡,数据科学家崛起,数据科学家实际上是统计学家,统计专家,软件程序员、图形设计师和作家的合体。数据非常之多而且具有战略重要性,但是真正缺少的是从数据中提取价值的能力。这也就是为什么统计学家、数据库管理者和掌握机器理论的人是真正了不起得人。