时间:3月7日
内容:引言、第一部分前半
地点:寝室
终于结束了广告学原理的阅读,感觉这本书虽然很厚,但是还是拖了很久才读完,今天刚刚读完了其后半部分的多样媒体广告的具体运用环节,感觉和国内的现状而言并不是十分贴切,就快速的通读了一遍,再转向大数据时代这本书。
这本书的目录编写的十分简明,其大致分为三个部分,第一个部分是介绍大数据作为一种理念,对人们的思维所产生的颠覆性作用,第二部分则是其在商业领域的应用,第三部分是以一个宏观的角度来审视大数据管理方面存在的情况,今天我阅读的就是引言部分,即以一个总括性的视角来引入大数据这一概念,以及第一部分的前半部分。
引言部分首先就提出了大数据在公共事业的各个方面所产生的作用,通过这一部分的阅读我想到了上学期学习的社会科学研究方法中的回归分析,虽然只是做了一个粗略的了解,但是,结合大数据在机票价格预测上的应用,其实就是利用了回归分析的模型,所以说,大数据就相当于湖泊中的水,我们可以将他去发电、饮用、作为一个景观,而类似回归分析这样的思路或研究方法就发挥着水坝、水管的作用,这也印证了作者之后的一个观点,即大数据使全样本数据可以循环使用,而不必像抽样调查所得到的数据那样阅后即焚。
其实令我感兴趣的并不仅仅是关于大数据的叙述,而是作者在引言部分以人类学的宏观视角出发对知识爆炸所做的一番简短的陈述,在寒假的时候我阅读了最近较为火爆的《三体》,其中对人类的知识结构做了一番生动的阐述,拿物理学来说,如果没有基础物理知识作为支撑,在此基础之上的技术是具有瓶颈的,再结合到本书中说的技术爆炸,就意味着在基础领域上,出现了新的突破或新学说,从而使得技术能够进化到今天能够处理大数据的程度。所以总体来说,引言部分主要提出了数据自身的特性、数据与技术的关系,以及粗略的应用部分。
接下来进入第一章节的阅读,第一章节介绍大数据特性,相信早已被很多人烂熟于心,简而言之,即全数据收集、混杂性、追求怎么样。而我阅读的这一部分是全数据收集的部分。
在这一部分中,我认为对大数据的“大”所做的一番解析是最为重要的一个概念区分,文中说“大”并不是单纯的样本数量大,
大数据的“大”是相对意义而不是绝对意义。
我总结了就是全而非多。
在一个数据集合中,可能只有个位数的数据,但是你全部收集了,就可称之为大数据,如果数据量级以上万计,即使样本有上千个,远远超过前一个数据集合的百倍,都不能称之为大数据,所以大数据,我认为在第一章节这一部分的语境中,就是指全数据。
这本书其实在大学本科的时候就买了,但是只是当初粗略的阅读了一下,在互联网领域,大数据如日中天,但感觉已经没有当初横空出世时的惊世骇俗,特备是互联网领域知识迭代的快速,让我感觉是时候去阅读这本书了,鉴于这本书的可读性,我预计将会在三天之内读完这本书。