原文: Data Scientist versus Statistician
https://www.datasciencecentral.com/profiles/blogs/data-scientist-versus-statistician
许多统计学家认为数据科学是关于分析数据的,但不止于此。数据科学还包括自动处理的实现算法,以提供自动化预测和操作,例如:
自动出价系统
估计(实时)美国所有房屋的价值(Zillow.com)
高频交易
将Google广告与用户和网页进行匹配,最大限度地提高转化率
与任何Google搜索高度相关
亚马逊网站或Facebook上的图书和好友推荐
税务欺诈侦查和恐怖主义侦查
评分所有信用卡交易
计算化学模拟癌症治疗的新分子
早期发现流行病
分析美国国家航空航天局图片以寻找新的行星或小行星
天气预报
自动驾驶(飞机和汽车)
客户定制的定价体系(实时)的所有酒店房间的问题涵盖天文,欺诈检测,社交网络分析,搜索引擎,金融(交易进球),环境,药物研发,贸易,工程,定价优化(零售)能源(智能电网),招标和套利系统。
所有这些都涉及统计科学和TB级数据。大多数人这样做并不称自己为统计学家。他们称自己为数据科学家。
统计学家一直在收集数据并进行数个世纪的线性回归。 DAD(发现/接入/提制)300年前由统计人员进行的,20年前的今天,还是在2015年就此而言,几乎没有今天的数据科学家演出与爸爸来。这里的关键消息做最终,随着更多的统计学家拿起这些新的技术和更多的数据科学家拿起统计科学(取样,实验设计,置信区间 - 不只是在我们的书第五章中所描述的),边境数据科学家和统计人员之间想要模糊。事实上,我们拥有非常高的统计知识库,并且我们有一个Hadoop。
那么是什么让数据科学家differentFrom计算机科学家是GDP有一个更强大的统计背景,在计算统计尤其是爱情,但有时这是在实验设计,取样和Monte Carlo模拟。