【我读《Big Data》】预测---大数据的核心

正文之前

我最近老是喜欢开一本新书,然后写点东西但是读到后面就不写了。这个习惯不是很好啊,但是阅读的速度确实比输出的速度快的太多了。就好比这本《Big Data》 我都读到195页了。但是我写的读书笔记还在16页晃悠,心塞。不过还好吧。今天多输出点,当做复习好了~~~

正文


大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。

image.png

在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。因为我们可以在巨量的历史记录里面对一件事情进行相关性判断,毕竟很多时候,我们判断的准则都要依靠着前辈的经历,而当我们所有的历史都被数据化以后,这些依靠着案例活下去的判断领域,怎么会需要人类来干活呢?就好比无人驾驶这话事情。当计算机能够判断出来每种环境下该怎么做出应对的时候,我们就不需要司机了。因为计算机的反应能力能够做到人类反应的几千上万倍。当然,无人驾驶离我们还有很多的技术难关需要克服!但是计算机系统可以发挥作用的领域远远不止驾驶和交友,还有更多更复杂的任务。别忘了你在京东买本书就会有一大堆的推荐跑到你的购买页下面。

image.png

就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。


大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法。

  • 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。全世界目前感觉都进入了大数据的“军北竞赛” 各种各样的授权,数据采集协议迷晕了我们的眼睛。传感机技术空前发达,存储成本不断下降,存储密度千万倍上升,大数据的成本较之小数据时代下降了千百倍。

  • 第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。不是不追求精确性,而是暂时还没发追求精确性吧?能精确我们当然要求精确,但是对于推荐系统的使用者--也就是用户来说,是不存在精确的,只能说准确率很高这种话,比如我今天买完《疯狂Java讲义精粹(第2版 附CD-ROM光盘)》,旁栏就会出现很多的类似的讲义,java学习教程等等,但是我现在突然看到旁边有人在看《C++ Primer》 所以我想买一本,这个事情是不存在与数据库中的,全世界独一份,总不会在一分钟前有一个人也买java 然后看到旁边有个人,也顺手买了本《C++ Primer》,然后被系统捕捉到按照这种清奇的线路给我推荐吧?那只能说是命了~~

image.png
  • 第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。(这一点翻译的作者对于原作者不是很赞同,我也举得如此,因果是保证准确性的基础之一,太多的领域还是需要精确新的。大数据目前能影响到的也就是大局上的把握,对于细节是没法准备的评估的,就好比我们可以给所有买java讲义的人推荐 Android讲义一样,但是你没法追求二者之间的因果关系,因为这是大数据对长期的人类购买行为的一种记录,还是完全遵循着计算机的准则,没法跳出限制,而人类的思维是永远无法准备的捕捉的。如果计算机始终为人类服务,那么就只能逼近,而无法正确预判)

如果数百万条电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来得重要。同样,只要我们知道什么时候是买机票的最佳时机,就算不知道机票价格疯狂变动的原因也无所谓了。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。在这些不需要追求更深层次的发展的方面,大数据确实够用了。而且对于从经验时代到大数据时代的过渡期人类来说,大数据的准确度让人着迷,但是如果我们要寻根问底。那就不好说了。做物理实验,如果只是追求99%的准确度,那么后续的实验又会有一个1%的偏移量,当多次累加,直到我们一门基础学科之上的学科的建立的时候,准确度可能已经不足50%了。复利效应的反效果~


(PS:下面这段话是作者说的👇 ,我对此还抱有疑虑,毕竟大数据本质上来说也是经验之谈,因果是可以捕捉到未来的!当然,我更希望是相辅相成的局面,好比当年的海王星的发现,要是没有诸多的观测数据,从而推测海王星的存在,我们可能至今对太阳系的认识还存在巨大的缺陷,但是如果没有依据因果关系存在的物理学的计算,海王星是很难被观测到的)

寻找原因是一种现代社会的一神论,大数据推翻了这个论断。但我们又陷入了一个历史的困境,那就是我们活在一个“上帝已死”的时代。也就是说,我们曾经坚守的信念动摇了。讽刺的是,这些信念正在被“更好”的证据所取代。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。


正文之后

最近被自己的咸鱼深深困扰着,这几天看了两本小说---<大王饶命> <重生之大涅槃> 第一本是真的精彩至极,第二本,勉强8分吧。强行装逼之嫌~ 第一本浓浓的逗比风格让我很是可乐,推荐大家也去看,有311章了,可以收割了~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容