有一天我要给客户介绍微博的各个推广位,右边及底部的广告位一直跳出我昨晚搜索过的蕾丝内衣。性感的肉体不停的闪现。给客户介绍的那几分钟是我为数不多的人生尴尬之一。
后来我知道这是网页的抓取功能,有专业的名称——“爬虫”。只要你在淘宝或者别的网页搜索过特定名词,不管你打开什么网页,广告位总是你刚搜索完的物种。这是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,搜索引擎优化很大程度上就是针对爬虫而做出的优化。
以上,可以俗称大数据统计。
我曾经服务过的一家公司是“海关数据”的整合公司,用海关编码可以查询到这款产品的进出口数据,包括中国的每年的出口数据,美国、俄罗斯、加拿大等各国的进口数据。通过中国的海关出口单据、海外的到港数据及各种提单进行完美整合的一款产品。这有什么用呢?举个例子,你是生产毛绒玩具的生产商,通过毛绒玩具的HS编码,你会在平台上找到这款产品在之前的5-10年每年的出口数量是多少,进口国最大的国家是哪一国。进口这些产品的商家是什么公司,运气好的可以找到这些进口商的联系方式。进出口知识丰富的可以通过一张提单的数据反推出一款产品的成交价格是多少,这家企业一年的进口数量是多少。接下来,针对这个企业的报价单就可以完美呈现自己生产的毛绒玩具有多符合这个客户的需求。《货币战争》早就告诉我们提前知道一些数据对自己有多管用。通过数据统计分析得出自己想要的信息,这就是大数据的魅力。
我可以再举个例子,购买过这款产品的有一个客户,他们是几个开外贸公司的年轻人,购买了一款产品的海关数据,涵盖该产品的各国概况、准入标准、各国政策、以及10年内产品的进出口数据。经过一段时间的潜心研究后,他们发现了在某洲的一个地区led灯的进出口数量都为零。但是这个地方的周边地区都已经在大量采购led灯泡了。他们直接买了机票飞到该国,实地考察当地市场,一家一家商超及经销商的去洽谈led灯泡的销售。一年后,他们收获了这个地区的2000万订单。
有些人可能觉得统计没有这么强大的能力。那么说个最简单的,一家餐厅刚开始营业,并不能确定自己每天的销售数量,但是第二天,店主可以通过第一天的销售大致预估准备第二天的食材,第三天可以通过前几天的销售准备当天的食材,一个月之后是不是可以通过数据统计分析得出餐厅下个月的备货数量了?这就是统计学啊!
一家超市卖薯片。他想知道哪个口味的薯片卖得最好,那么最好的办法就是整理自己的出库小票。用一个月、一年、三年的数据来得到最接近事实的数据。同理也可用于薯片生产商。
现在做电商,各大平台都会提供相应的数据分析,可以让你看到你想销售的产品在该平台一年有多少销量、你设定的关键词有多少搜索量、这款产品主要分布在哪些区域、价格区间是多少,购买对象集中在哪个区域,什么年龄段。这似乎已经成为了做好电商的必备工具。这就是大数据分析。
虽然我们现在把大数据、统计、分析说的很神奇,但是这其实始于20世纪20年代的一位女士,她提出将茶倒进牛奶与将牛奶倒进茶中所产生的味道不一样。罗纳德.艾尔默.费希尔听到了这个说法,他决定用一组实验来验证这位女士的这句话。第一次统计分析便是记录在册的这次:提出论点——提出假设——进行实验验证。
数据统计、实验统计是怎样改变我们这个世界的运作和生活的呢?我还有很多例子可以举,但是要知道这段历史和其中的故事大家可以来阅读这本《女士品茶》,书本会告诉你统计学是如何变革来科学和生活。书中介绍一个新的概念时,穿插了大量的背景介绍,再辅以相关奇闻异事。就算你对概念一窍不通,但读完一个章节,你就能明白其中的特定概念。书里讲的故事,可比我前面讲的内容有趣多了。
比如:大家都知道“概率”的意思吧,但是在这本书里非常细致了讲了概率的出现,各种大拿提出的理论,以及最后“概率”的各种野史。
最后我想说句,我一直觉得能写这种书的人特别牛,不仅要博览群书、逻辑清晰,还要是个特别有耐性的人,唯有将读者都当成“弱智儿童”才可以将这些概念介绍得如此细致,如此不让你接着提问为什么。