书单 | 做数据分析不得不看的书有哪些?

数据分析是精细化的运营工作,一定要建立起体系化的思维,切勿盲目分析,粗暴分析。

对于运营数据分析,我相信很多小伙伴会存在以下问题:

  • 面对异常数据经常出现“好像做了什么?好像发生了什么?所以可能造成了影响”的主观臆测?

  • 面对数据报表,不知道该怎么分析?不知道该分析什么?

数据分析是一门方法和技术,也作为运营最基础的一项技能,在运营工作中无处不在,无论是活动复盘、专题报告、项目优化,还是求职面试,数据分析都有一席之地。

你是否真正的将其价值发挥出来呢?合格的运营一定是数据驱动运营,而非运营驱动数据!

当然任何一个技能的学习,都由从浅到深的过程,数据分析也不例外。一个完整的数据分析知识体系类似金字塔结构:最顶层是对数据价值的认知、业务理解,中间是数据分析方法论,而最底层则是数据分析的解决方案或者具体的操作方法。

我把数据分析的推荐书籍划分成三个段位,便于大家渐进式学习,并在各平台上手动搜集、整理了近100本数据分析、挖掘方面书籍资源分享给爱学习的你。

但是这之中所有的书籍真的是适合你吗?

为了避免广告嫌疑,我针对每本书籍做了统计。(手动盘点,可能会有误差)

为了让大家各取所需,我将书籍类型分为中文版和外文版本

然后又去各大书籍平台豆瓣(中文书籍),Goodreads(英文书籍)看简介,看评分;顺带在当当、京东,亚马逊看价格,看销售量,总结得了下面的表格。

话不多说,关门落闸放单!

预告;应该比较少图,流量党可以放心的。

英文版

入门篇:

image

1.Head First Data Analysis

内容简介:此书包括了逻辑思维、统计知识、贝叶斯、可视化、软件使用等多方面的内容,提供了一个很宽的视野。非常的浅显,适合小白入门。

2.machine learning in actio

内容简介:全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

3.Probability And Statistics

内容简介:本书包括概率论、数理统计两部分,内容丰富完整,适当地选择某些章节,可以作为一学年的概率论与数理统计课程的教材,亦可作为一学期的概率论与随机过程的教材。适合数学、统计学、经济学等专业高年级本科生和研究生用,也可供统计工作人员用作参考书。

4.Building Machine Learning Systems with Pytho

内容简介:虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。

5.scipy and numpy

内容简介:这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。

6.Python Machine Learning

内容简介:最好的一点是书中所用的scikit library是公开的,可以边看边操作。作为一本cookbook,基本没有深究技术理论,对于新手来说十分容易入口。

7.Think Python

内容简介:全书共19章和3个附录,详细介绍了python语言编程的方方面面。《像计算机科学家一样思考python》是一本实用的学习指南,适合没有python编程经验的程序员阅读,也适合高中或大学的学生、python爱好者及需要了解编程基础的人阅读。对于第一次接触程序设计的人来说,是一本不可多得的佳作。

8.Natural Language Processing With Python

内容简介:如果你要是自然语言学或语言信息处理相关专业的学生,又对python与nltk感兴趣的话,就看这本书吧,可以当做入门读物来看,整本书即涉及到了语料库的操作,也对传统的基于规则的方法有所涉及。全书包括了分词(tokenization)、词性标注(POS)、语块(Chunk)标注、句法剖析与语义剖析等方面,是nlp中不错的一本实用教程。

9.Algorithms

内容简介:非常好的算法入门书籍, 这个应该算是一个实践派的, 理论派还是看CLRS吧, SW的图解非常到位, 算法书很少有做到这种详解图的, 不过说实话, 还是有些啰嗦.这个和CLRS对照的看, 应该是最适合的方法了

10.Grokking Algorithms: An illustrated guide for programmers and other curious people

内容简介:一本算法入门书中的入门书!通篇简单讲解了分治、递归、BFS、Dijkstra、动态规划、贪婪算法等。但是配图有趣易懂,使用python代码,比伪代码更易懂,比Java或C更容易写。读完会对算法和数据结构有不错的了解,并且皆有可能勾起深入学些了解的兴趣。

11.Introduction to Information Retrieval

内容简介:对于搜索引擎的初学者里说,本书是一本绝对值得阅读的书目。作者从最简单的布尔检索到一个完整的搜索引擎,逐步深入,逐步引导读者思考,对建造一个大型搜索引擎需要用到的架构和算法都有所涉猎,看完后会对搜索引擎有一个大概的认识,对其基本原理也会有所了解。搜索引擎并不仅仅是检索信息,它还有一个更重要的用处是对返回的结果进行排序,而这往往是非常重要的。

————————————————

进阶篇

image

11.convex optimizatio

内容简介:本书内容非常丰富:理论部分由4章构成,应用部分由3章构成,算法部分也由3章构成。

12.learning to rank for information retrieval

内容简介:本书是为研究人员和研究生编写的,用于信息检索和机器学习。他们将在这里找到对驱动搜索引擎开发最新进展的领域中最先进技术的全面描述。

13.bayesian reasoning and machine learning

内容简介:这本动手实践的文本为具有适度数学背景的计算机科学专业学生提供了这些机会。它在图形模型框架内开发从基本推理到高级技术的所有内容。每一章都包括许多基于计算机和理论的例子和练习。包括MATLAB工具箱,可在线获取。

14.Linear Algebra and Its Applications

内容简介:本书主要内容包括线性方程组、矩阵代数、行列式、向量空间、特征值与特征向量、正交性和最小二乘法、对称矩阵和二次型等。此外,本书包含大量的练习题、习题、例题等,便于读者参考。

15.SQL Cookbook

内容简介:把很多SQL query里的陷阱都提到了,而且每道题给出了市面上所有流行数据库(MySQL,DB2,Oracle,SQL Server,Postgresql)的Query代码。

16.R in Action

内容简介:通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧!

17.All of Statistics: A Concise Course in Statistical Inference

内容简介:注意,我觉得这本书是给的统计底子很好的人复习用的,不适合自学。本书适用于想要快速学习概率和统计数据的人。它将现代统计学中的许多主要思想集中在一个地方。本书适用于统计学,计算机科学,数据挖掘和机器学习的学生和研究人员。本书涵盖了比典型的数理统计入门文章更广泛的主题。

18.Bayesian Methods for Hackers

内容简介:本书通过强大的Python语言库PyMC,以及相关的Python工具,包括NumPy\SciPy\Matplotlib讲解了概率编程。更加深入地介绍怎么用Python做贝叶斯统计!

20.Practical Statistics for Data Scientists: 50 Essential Concepts

内容简介:本书应该算是填平课堂的统计学和工业界数据科学的一本很好的参考指南。写得比较简洁但是直击要点,而且给出了很多reference。

21.Applied Predictive Modeling

内容简介:黄皮书,没啥好多说的。准备面试和工作的时候必读。(豆瓣提示,千万不要看中文版的)

22.Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies

内容简介:把机器学习算法拆开,结合案例,一步一步地给你讲。

23.Real-World Machine Learning

内容简介:告诉你工业界的人怎么用Machine Learning解决实际问题的书。建议所有Data Scientist在实习前和全职工作开始前都读一下。

24.Learning From Data

内容简介:讲清楚了很多机器学习书中不怎么提到的机器学习理论,比如VC Dimension这种东西。Caltech有公开课,吐血推荐:

25.Fluent Python

内容简介:本书由奋战在Python开发一线近20年的Luciano Ramalho执笔,Victor Stinner、Alex Martelli等Python大咖担纲技术审稿人,从语言设计层面剖析编程细节,兼顾Python 3和Python 2,告诉你Python中不亲自动手实践就无法理解的语言陷阱成因和解决之道,教你写出风格地道的Python代码。

26.Python for Probability, Statistics, and Machine Learning

内容简介:本书涵盖了在这些领域中使用Python模块说明概率,统计和机器学习的关键思想。整个文本,包括所有数字和数字结果,可以使用Python代码及其相关的Jupyter / IPython笔记本重现,这些笔记本作为补充下载提供。作者通过使用多种分析方法和Python代码处理有意义的示例来开发机器学习中的关键直觉,从而将理论概念与具体实现联系起来。

27.Python Data Science Handbook

内容简介:本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。

28.Problem Solving with Algorithms and Data Structures Using Python

内容简介:一本用Python讲数据结构和算法的好书。非常优秀的intro。图文并茂。缺点就是同觉得代码似乎并不pythonic,图论那一章感觉比较草率就过去了。

29.Algorithms in a Nutshell: A Practical Guide

内容简介:《算法技术手册》内容简介:开发健壮的软件需要高效的算法,然后程序员们往往直至问题发生之时,才会去求助于算法。《算法技术手册》讲解了许多现有的算法,可用于解决各种问题。通过阅读它,可以使您学会如何选择和实现正确的算法,来达成自己的目标。另外,书中的数学深浅适中,足够使您可以了解并分析算法的性能。

30.The Data Science Handbook

内容简介:本书选取世界知名的25位数据科学家进行了深度的访谈,从不同的视角和维度,将他们的智慧、经验、指导和建议凝聚成册。每一篇访谈都是一次深度的交流,涵盖了这些数据科学家最初从菜鸟起步,运用各种知识武装和充实自己,一直到最终成为一名卓有成效的数据科学家的全过程。通过阅读本书中的访谈,读者可以形成对数据科学的宏观认识和了解,更深刻地认识和体验数据科学家的角色,并且从这些前辈的过往经历中学到宝贵的知识和经验以应用于自身的成长和事业中。

31.Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython 2nd

内容简介:andas官方指南第二版。本书的结构比较特别。前两章是背景介绍。第三、四、五章分别介绍了一下iPython,NumPy,pandas。第六到十一章是一些比较具体的功能的介绍以及实例,以pandas的使用为主,中间却又插进了一个讲matplotlib的第八章。第十二章又回到NumPy。全书最后还附了一个大约三十页篇幅的Python快速入门。

32.Storytelling with Data: A Data Visualization Guide for Business Professionals

内容简介:怎么画出又漂亮又高大上的图表,然后讲一个好故事把你的老板和客户忽悠得一愣一愣的,是一个好的数据科学家的终极大招之一。

33.Communicating Data with Tableau: Designing, Developing, and Delivering Data Visualizations

内容简介: 本书介绍如何使用Tableau Software将原始数据转换为引人注目的数据可视化,从而提供洞察力或允许查看者自己探索数据。本书是分析师,工程师,营销人员,记者和研究人员的理想选择,它描述了数据通信的原理,并带您深入了解常见的可视化方法。您将学习如何使用Tableau Desktop 8.1和Tableau Public 8.1制作清晰明确的数据可视化。

34.Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data

内容简介:作者Kyran Dale教您如何利用最佳Python和Javascript库的强大功能,使用引人入胜的示例并强调来之不易的最佳实践。

35.The Wall Street Journal Guide to Information Graphics

内容简介:“华尔街日报”的新闻图形总监倾力之作,本书通过循序渐进的指南和清晰简洁的图形,为我们展示如何使用不同的技术来有效地传达消息。

36.The Elements of Statistical Learning

内容简介:Frequentist经典,书里不少算法值得亲自推导,细啃收获很大,但是略微不同意老先生对Neural Nets的看法,虽然这个模型从数学上讲是那样的,但是这模型的根源绝对没这么简单,尤其在看了Computational Neural Science以后。目前Bayes统计也要收官啦,下一阶段开啃Hinton用PRML开课的讲义。感谢Hastie!

37.data analysis using sql and excel

内容简介:质量保证,sql和excel是数据分析必备的技能。本书帮助您使用SQL和Excel从关系数据库中提取业务信息,并使用该数据定义业务维度,存储有关客户的事务,生成结果等。每章都介绍了执行特定类型的业务分析的时间和原因,以便获得有用的结果,如何使用SQL和Excel设计和执行分析,以及结果应该是什么样的。

38.Agile Data Science: Building Data Analytics Applications with Hadoop

内容简介:作者立志打造一个full-stack解决方案(包括开发框架、运行环境等,有了它无需再下载别的软件)来减少前期在数据准备上必须花费的大量时间。

39.Fast Data Processing with Spark

内容简介:Spark同Hadoop一样是基于Mapreduce算法实现的分布式计算,不同的是任务的中间输出结果可以保存在内存中无需读写HDFS,所以更加适合需要进行反复迭代的机器学习算法实验.

40.Data Analysis with Open Source Tools

内容简介:无论对于数据分析入门还是有经验的高手,读来都受益。作者试图传达的几个观点:简单 优于 复杂 便宜 优于 昂贵明晰 优于 晦涩目的 比 过程更重要洞见 比 精确更重要理解 比 技术更重要勤于思考 少干活!

——————————————

深入篇

image

42.pattern recognition and machine learning

内容简介:绝对是经典中的经典。本书适用于机器学习,统计学,计算机科学,信号处理,计算机视觉,数据挖掘和生物信息学等课程。

43.Doing Data Science: Straight Talk from the Frontline

内容简介:介绍了数据分析法、一些机器学习算法、线性回归和逻辑回归、朴素贝叶斯等等。其中有一些内容需要一些数学基础才能吃透。 第六到十章节是本书的精华,详细介绍了如何利用金融及社交网络中的数据进行数据建模分析,值得反复回味。

44.Programming Collective Intelligence

内容简介:本书最显著的特点是,实战性极强!针对每个算法,他从头到尾演示了一个完整的实现过程:从获取数据,组织存储,到算法实现,加载运算,再到最后的结果的分析利用。书中所有的例子均基于实际系统的真实数据,作者演示了大量的开放 API 的使用,Delicious、Amazon、Last.fm、Google News,各个都是大名鼎鼎,每步都是真刀真枪。跟着书中的操作这样一趟走下来,你会豁然开朗,原来这些看似神秘复杂的系统,也不过如此。

另——————————

45.R教主Hadley Wickham的三本书

R 社区领军人物作品,从典型数据科学项目所需工具模型着手,带领读者掌握 R 语言精华,学会熟练使用多种工具解决各种数据科学难题。

  • R for Data Science:本书深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象的类型、R的记号体系和环境系统、自定义函数、if?else语句、for循环、S3类、R的包系统以及调试工具等。本书还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能。本书适合立志成为数据科学家的R语言初学者阅读。

  • R Package:讲授好的R的软件工程实践,并使用包打包、记录和测试代码。

  • Advanced R:可以帮助你更好的掌握R编程语言,并告诉你R的运行机制。


中文版

image

入门篇

image

1. 《谁说菜鸟不会数据分析-入门篇》

内容简介:分别讲解数据分析必知必会的知识、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美、数据分析报告的撰写技能以及持续的修炼。

2.《谁说菜鸟不会数据分析-工具篇》

内容简介:满书写尽数据分析实战技巧Access、SQL、PowerPivot、Excel数据分析工具库、水晶易表、VBA一个都不少!

3.《谁说菜鸟不会数据分析-SPSS篇》

内容简介:从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且非常实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。

3. 《大数据时代》

内容简介:维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。 本书的核心在于大数据预测,并在书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

4. 《深入浅出数据分析》

内容简介:以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;

5.《深入浅出统计学》

内容简介:本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区 间的构建、假设检验、卡方分布、相关与回归等

6.《啤酒与尿布:神奇的购物篮分析》

内容简介:啤酒和尿布的故事是营销届的神话,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售、并获得了很好的销售收益,这种现象就是卖场中商品之间的关联性,研究“啤酒与尿布”关联的方法就是购物篮分析,购物篮分析是沃尔玛秘而不宣的独门武器,购物篮分析可以帮助我们在门店的销售过程中找到具有关联关系的商品,并以此获得销售收益的增长!

7.《New Internet:大数据挖掘》

内容简介:从算法到工具,再到DM在日志分析、营销邮件、电商、移动等业务中的实际应用,内容有较全面的介绍,语言浅显易懂,作DM领域进门读物很不错。

8.《SPSS其实很简单》

内容简介:给统计软件初学人员一个很简单、直接、好用的指导,值得一看。国外的很多入门级别的书很值得一看,写的很通俗易懂,这本书应该说是spss入门级别最常见,被推荐最多次数的书了吧。

9.《数据挖掘:概念与技术》

内容简介:这本书的内容主要是分类,也有一部分聚类的内容,关联规则发现基本上没有讲。但它对分类讲的很详细,主要的思想都涉及到了,体系整理很好。它对相关的知识,如分类算法的性能估计,如何在分类中结合成本考虑等也做了详细的介绍。

10.《快速数据分析》

内容简介:太好了,一本深入浅出,内容实用的中文Spark入门书籍。Learning Spark中译本!

11.《统计分析与SPSS应用》

内容简介:这本书是很多大学指定教材,个人觉得挺适合初学者的,简单易懂,也有较多的案例分析。

12.《利用python进行数据分析2nd》英文版:Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython 2nd

内容简介:还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。 由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

13.《算法》英文版:Algorithms

内容简介:《算法(英文版•第4版)》作为算法领域经典的参考书,全面介绍了关于算法和数据结构的必备知识,并特别针对排序、搜索、图处理和字符串处理进行了论述。

————————

进阶篇

image

14.《数据之美》

内容简介:本书通过世界上最好的数据工作者的示例,向读者展示处理数据的方法。本书使得读者可以站在优秀的数据设计师、管理者和处理者的肩上,去仔细审视涉及到数据的一些最有趣的项目。

15.《数学之美》

内容简介:作者吴军博士几乎把所有文章都重写了一遍,为的是把高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。读者通过具体的例子学到的是思考问题的方式 —— 如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。

16.《大数据时代》

内容简介:本书的核心在于大数据预测,并在书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

17.《统计学习基础:数据挖掘、推理与预测》

内容简介:《统计学习基础:数据挖掘、推理与预测》介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。《统计学习基础:数据挖掘、推理与预测》内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。

18.《网站分析实战,如何以数据驱动决策,提升网站价值》

内容简介:本书以通俗易懂的方式来讲解网站分析所需掌握的知识,剖析日常工作中遇到的问题,并且配合大量的实战案例的讲解。 不管你是做网络营销、互联网产品设计、电子商务运营、个人站点运营维护,我们都希望从数据中寻找有价值的结论,并且指导公司管理层的决策,最终创造更大的网站价值。

19.《数据挖掘与数据化运营实战,思路,方法技巧与应用》

内容简介:《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。

20.《数据化决策》

内容简介:数据无孔不入,大数据时代,谁掌握了数据,谁就能把握成功。“一切皆可量化”,道格拉斯这个大胆的宣言是解决诸多生活和商业问题的关键所在。本书详细讲解了:专注于量化不确定性、风险和数据价值;提供了令人拍案惊奇的测算无形之物的简便方法,让你仅仅基于已知数据就能准确决策;展示了丰富而精彩的量化案例,让身边的数据唾手可得。 本书兼具实用性、可读性与趣味性,甚至让反感数据的人也能发现它的亲切。

21.《推荐系统实践》

内容简介:研究推荐系统必须要读的书,而且是第一本要读的书。

22.《python自然语言处理》(英文版:Natural Language Processing With Python)

内容简介:这其实就是一本NLTK的官方文档,附带介绍了一些基础的Python语法和NLP领域知识,并且主要还是英文NLP领域。目前看来有些过时。如果想了解的话也不应看这本译文版,建议上网站 www.nltk.org/book 获取最新的功能介绍。不过书后的练习题很是不错,如果想深入NLTK的话一定要做做题,光看是解决不了任何问题的。

23.《深入浅出MYSQL数据库开发、优化与管理维护》

内容简介:从数据库的基础、开发、优化、管理维护和架构5个方面对MySQL进行了详细的介绍,每一部分都独立成篇。基础篇主要适合于MySQL的初学者阅读,包括MySQL的安装与配置、SQL基础、MySQL支持的数据类型、MySQL中的运算符、常用函数、图形化工具的使用等内容。

24.《大数据挖掘系统方法与实例分析》

内容简介:本书是大数据挖掘领域的扛鼎之作,由全球科学计算领域的领导者MathWorks(MATLAB公司)官方的资深数据挖掘专家撰写,MathWorks官方及多位专家联袂推荐。它从技术、方法、案例和*佳实践4个维度对如何系统、深入掌握大数据挖掘提供了详尽的讲解。

25.《问卷统计分析实务-spss操作与应用》

内容简介:在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。

26.《数据挖掘与R语言实战》

内容简介:本书利用大量给出必要步骤、代码和数据的具体案例,详细描述了数据挖掘的主要过程和技术,广泛涵盖数据大小、数据类型、分析目标、分析工具等方面的各种具有挑战性的问题。

27.《python数据分析与挖掘实战》

内容简介:本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。

28.《赤裸裸的统计学 》

内容简介:结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。

29.《消费者行为学》

内容简介:本书主要特色如下: 由微观到宏观,由个体到群体,从市场、个体、决策者、亚文化和文化五个角度逐层剖析消费者行为,突出多学科、综合性的研究视角,反映全球化、数字化背景下消费者行为的最新发展。 保留了所罗门教授原著的内容框架和理论精华,增加了中国消费者行为的重要内容及本土案例,更具本土化特色,更加适应中国市场的需要。

30.《流量的秘密》

内容简介:流量的秘密:Google Analytics网站分析与优化技巧》将运用最新的网络计量学方法,教你获取真正有价值的信息。 哪种市场营销活动最有成效?如何量化这些效果?应该从哪些衡量指标进行追踪?《流量的秘密:Google Analytics网站分析与优化技巧》介绍的Google Analytics分析工具,将帮你完美解决这些问题,让你真正量化网站的成效。 《流量的秘密:Google Analytics网站分析与优化技巧》讲述了安装和配置Google Analytics最实用的技术,目标很明确:将最大化网站潜力所需要的知道奉献给读者。通过了解网站的访客,你可以如手术刀般精准地调整网页内容和营销预算,以期获得更佳的投资回报率。 《流量的秘密:Google Analytics网站分析与优化技巧》适合市场营销人员、网站管理员、网站决策人员,还有所有对网站营销有商业兴趣的人。

31.《用户体验度量》

内容简介:有效地测量任何产品的可用性都需要选择和使用正确的度量.并要有效地利用它所揭 示出来的信息。《用户体验度量》首次介绍了相关实用资料.可以使可用性从业人员和产品开发人员完成这种测量。作者把几十个种度量整理成六类:绩效、基于问题的、自我报告式的、Web导航、综合性的/派生的, 以及生理/行为的。他们对每一种度量都进行了考察,并认真考虑了收集、分析和呈现这些数据的最佳方法。他们对使用任何技术来测量任何类型产品的可用性都提供了步进式指导。

32.《数据可视化之美》

内容简介::在《数据可视化之美》中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。

——————————

深入篇

image

1.《数据挖掘与知识发现2nd》

内容简介:本书详细地介绍了关联规则、聚类分析、决策树、贝叶斯网络、人工神经网络、支持向量机、粗糙集、模糊集等数据挖掘模型与算法。

2.《数据挖掘技术》

内容简介:本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。

3.《机器学习》

内容简介:《机器学习》展示了机器学习中核心的算法和理论,并阐明了算法的运行过程。《机器学习》综合了许多的研究成果,例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等,并以此来理解问题的背景、算法和其中的隐含假定。

4.《精益数据分析》

内容简介:本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,让你深入理解精益创业、数据分析基础,和数据驱动的思维模式。

5.《集体智慧编程》(英文版:Programming Collective Intelligenc)

内容简介:本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。 本书是Web开发者、架构师、应用工程师等的绝佳选择。

6.《数据挖掘导论》(英文版:Introduction to Data Mining)

内容简介:本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。本书也是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。


我相信,除了上面所说到的书籍之外,其实还有很多好的书籍还隐藏在角落里,还未被我们发现。

正因为如此,我会尽可能到处挖掘和发现与众不同,从未看过的书籍。

在我朋友圈里,我将会把挖掘到的好书分享给大家。

如果你有发现到好看的书籍,非常欢迎加我的【 微信 】,推荐给我!以上完成的表格也可以加我微信 【 helloeternalflame 】,回复 “ 数据 “获取。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,913评论 2 89
  • SpringBoot项目中使用WebSocket配置广播式通信 通过@MessageMapping映射/welco...
    麦麦_202f阅读 192评论 0 0