回答Wiki
数据分析: -数据分析通常称为数据分析技术
数据挖掘: - 处理大量数据
数据科学: -主要包括数据+算法,其中,预测分析/建模,统计分析,概率模型,并包括DS中非常复杂的数学
机器学习: -让机器从数据中学习
大数据: - 任何比您更容易处理的数据。
数据科学与大数据 - 完美的比较
机器学习与人工智能和数据科学 - 突出了各领域之间的差异和相似之处
什么是Data Analytics - 初学者指南 - 数据分析的详细概述
Rohit Malshe,化学工程师,程序员,亚马逊研究科学家
回答2017年4月18日 ·由Upvoted艾伦·戴维斯, MS计算机科学与机器学习,德克萨斯大学达拉斯分校(2010年)和丹·韦瑟利, MBA数据分析,佛罗里达国际大学(2017年)·作者有 353个答案和 8.6米答案意见
几天以来,我一直想对这个问题进行一次尝试,但这看起来总是一项艰巨的任务,因为这个问题用得太多了。此外,这是一个很多人都有眼睛的问题,很多人已经写了详细的答案。
让我先重新排序所有重要的词:
大数据
数据挖掘
数据分析
Analytics(分析)
机器学习
数据科学
想象一下,你想成为一名数据科学家,并在像亚马逊,英特尔,谷歌,FB,苹果等大型组织工作。
那会是什么样子?
你必须处理大数据,你必须用SQL,Python,R,C ++,Java,Scala,Ruby等编写计算机程序,以便只维护大数据数据库。您将被称为数据库管理器。
作为从事过程控制的工程师,或者想要简化公司运营的人,您将执行数据挖掘和数据分析 ; 您可以使用简单的软件来执行此操作,您只需运行其他人编写的大量代码,或者您可能正在编写SQL,Python,R中精心设计的代码,并且您将进行数据挖掘,数据清理,数据分析,建模,预测建模等。
所有这些都将被称为Analytics。有几种软件可以做到这一点。一个受欢迎的是Tableau。其他一些是JMP和SAS。许多人在网上做所有可以使用基于SAP的商业智能设置的东西。在这里,可以轻松完成简单的报告。
此外,您将能够使用机器学习得出结论,并在无法获得分析答案的情况下提出预测。将分析答案视为[If / then]类型的计算机程序,其中所有输入条件都已知,并且只有少数参数发生变化。
机器学习使用统计分析来划分数据。一个例子是:阅读各种人在Yelp上写的评论,并从评论中预测该人是否会标记一家餐馆4星或5星。
如果这还不够,您也可以使用深度学习。深度学习用于处理数据,如音乐文件,图像,甚至是自然语言等文本数据,数据量很大,但类型非常多样化。
您可以利用一切优势〜分析解决方案,分区数据,黑客思维模式,通过编程实现自动化,报告,得出结论,制定决策,采取行动以及讲述有关数据的故事。
最后但并非最不重要的是,其中一部分将发生在巡航控制中,在那里你可能不在身体上,但你可能创造的程序本身就可以完成大部分工作。可能如果你把它带到人工智能水平,有一天它可能会变得比你聪明,不用说它已经比你快了。有一天,它可以达到你可能无法想象的解决方案让你感到惊讶的程度。
现在你是一名数据科学家,你所做的就是数据科学。
无论你做什么,你公司以外的人可能会或可能不会看到,例如,如果你在亚马逊工作,人们会问Alexa各种问题,或者如果你在谷歌工作,人们会向Google提出问题。或者他们可能没有看到你做的任何事情。您的职能将帮助公司更好地设计工作。
要做到这一切,您可能需要大量的专业知识来处理一些编程语言的数据和知识。
我在互联网上看到的一个流行的数据科学维恩图就在这里:请注意,数据科学家正处于许多事物的交叉点。沟通,统计,编程和业务。