[译]作为编程语言,在数据科学领域Python正在取代R语言

在PhD中,R语言依然很火,但是在时代的大潮流中,Python是王者。
Matt Asay (From MongoDB)2013年11月25号
Python
Python

对于数据科学家来说,R语言无疑是他们的选择,但是Python正在抢夺R语言的地盘。

关于这个改变有很多的原因,或许最大的原因是相对于R语言的难以掌握的复杂编程环境来说,Python更加通用,而且更加简单。

在一个越来越依赖数据世界,“简单”肯定会取得胜利。

R语言:并不真的是编程语言

人们煞费苦心地学习R语言一部分原因是它并不是一门编程语言。正如专家John Cook指出,R语言实际是一种数据统计的交互环境,并不真的是一门编程语言。他建议,与其把R语言看成一种编程语言倒不如认为它有编程语言的特性。

而且,R语言看起来一点都不像传统的编程语言,这对于将要成为R语言开发者来说,很难掌握。

但是R语言对于像这些数据统计的工具,比如SAS,SPSS,如Bob Muenchen指出R语言对于分析师来说可以说是减少了复杂度,因为它合并了宏(Marcro)和矩阵语言,而在其他语言中,比如SPSS,就需要你自己去掌握。但是如果期待R语言可以像Stata一样,他们会失望的。

综上,R语言。。。是不一样的,让事情变难了。。。

Python:降低了数据科学的门槛

然而Python是非常容易学习的。就拿一件事情来说吧,大多开发者都熟悉Python,而且可以在多种程序中使用它。不像R语言,只能用户数据分析领域,一个开发者可以在首次用脚本编写她的网站或者别的程序的时候就体验Python语言。

当企业苦苦地让数据工作的时候,他们还煞费苦心的寻找合格的数据科学家。然而,往往这样的数据科学家已经为他们工作了,而且应该熟悉Python。因为根据用户的数据提供正确的分析是如此的重要,所以在复杂的用户数据下,企业自己培养的大数据技术人才比需要自己培训新应聘的数据科学家高效得多。就像 Gartnet 的Svetlana Sicular所说的

一个Python统治所有

先不说使用现成的Python人才库,使用Python最大的受益是增加使用同一种编程语言在不同程序中的效率。德克萨斯大学奥斯汀分校研究员 Tai Yarkoni 解释:

已经表明使用同一种语言进行开发和分析会受益匪浅。就这么一点来说吧,当你可以只用一种语言来做所有的事情,你没有必要折磨自己说,Ruby使用block代替缩进,或者你需要在Python中调用数组的len方法而不是array.length来获取数组的长度。
而且,你永远不用担心项目中不同语言之间的接口问题。没有比在Python中处理相同的文字数据烦人了,最后把它们变成你想要的格式,然后才知道你不得不把它们以另一种格式写入磁盘,以至于你可以把它们转交给R语言或者Matlab来进行别的分析。个别的,这不是大问题。在Python中把它们以CSV格式或者JSON格式文件输出,在R中读取,进行加和。如果只用一种语言,所有这些都不再会有。

这并没有夸张的部分。当我们赞美合适的技术很好地解决了我们的问题的时候,技术就会胜出,这是通用的道理。就像 Optimization and Analytics 的 AppNexus 的董事David Himrod说的,“在AppNexus面临的最大的挑战是如何在统一技术领域聘到多样的员工。Python为员工提供了不同的背景,特别是工程师,数学家,分析师---一种常见的,简单易懂的语言可以被公司用来定义新的功能原型。”

使用Python的主流的数据科学

Python在数据分析方面仍然欠缺一些R语言的丰富性,但是二者的间距正在快速缩小.
要记住:Python成功的关键不是它处理神秘方法的能力上比R语言或者别的与前强,而是它容易学习和通用性。数据科学已经脱离初级极客的境界了,在上个月O'Reilly Strata大会上已经非常明显了。哲学博士们曾经常常出没的大会,现在普通的经济分析师和一些受企业派遣去分析大数据的人,已经成为此次大会的主要参加者。

这次新的大会更倾向于使用Python而不是R语言。Python相对来说简单易用,而且它们已经在别的项目中使用了它。在别的方面,人们更加倾向于已经精通的或者简单易学的工具而不是强大而复杂的工具,如果可能的话,应该避免使用这样强大而复杂的工具。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,372评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,368评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,415评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,157评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,171评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,125评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,028评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,887评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,310评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,533评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,690评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,411评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,004评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,812评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,693评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,577评论 2 353

推荐阅读更多精彩内容