如何在未来的大数据和机器学习领域,获得一份不错的工作?

2018 年,AI 的发展脚步会加快,这一年将是 AI 技术重生和数据科学得以重新定义的一年。对于雄心勃勃的数据科学家来说,他们如何在与数据科学相关的工作市场中脱颖而出?2018 年会有足够多的数据科学相关工作吗?还是说有可能出现萎缩?接下来,让我们来分析一下数据科学的趋势,并一探如何在未来的大数据和机器学习 /AI 领域获得一份不错的工作。”

在这里我还是要推荐下我自己建的大数据学习交流群:199427210,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴。

1、你需要牢固掌握概率统计学,并学习和掌握一些算法,比如朴素贝叶斯、高斯混合模型、隐马尔可夫模型、混淆矩阵、ROC 曲线、P-Value 等。

不但要理解这些算法,还要知道它们的工作原理。你需要牢固掌握梯度下降、凸优化、拉各朗日方法论、二次规划、偏微分方程、求积法等相关算法。

如果你想找一份高薪的工作,还需要掌握机器学习技术和算法,比如 k-NN、朴素贝叶斯、SVM 和决策森林等。

2、

现在大部分机器学习都需要海量数据,所以你无法在单台机器上进行机器学习。所以,你需要用到集群,需要掌握 Apache Hadoop 和一些云服务,如 Rackspace、Amazon EC2、Google Cloud Platform、OpenStack 和 Microsoft Azure 等。

你还需要掌握各种 Unix 工具,如 cat、grep、find、awk、sed、sort、cut、tr 等。因为机器学习基本上都是在 Unix 系统上运行的,所以需要掌握这些工具,知道它们的作用以及如何使用它们。

3、在掌握编程语言和算法的同时,不要忽略了数据可视化的作用。如果无法让你自己或别人理解数据,那么它们就变得毫无意义。数据可视化就是指如何在正确的时间向正确的人展示数据,以便让他们从中获得价值。主要的数据可视化工具包括:Tableau、QlikView、Someka Heat Maps、FusionCharts、Sisense、Plotly、Highcharts、Datawrapper、D3.js、ggplot 等。

4、要成为数据科学家,不一定非要拿到数据科学方面的学位。事实上,你完全不需要这么做,这样做反而不是个好主意。如果你能拿到计算机学位、工程学学位、经济学学位、数学学位、统计学学位、精算师学位、金融学学位或者自然科学学位(物理、化学或生物)都是可以的。甚至是人文科学(包括社会科学)也是可以的。

2018年跳槽指南:如何找到一份人工智能相关的工作?

AI前线 • 7小时前 • 技能Get

大数据把 AI 推向了技术炒作的舞台正中央,数据科学和机器学习在各行各业开始崭露头角

本文由 【AI前线】原创,原文链接:http://t.cn/RHqaB5p

作者|Tanmoy Ray,译者|薛命灯,编辑|Emily

AI 前线导读:“2017 年,大数据把 AI 推向了技术炒作的舞台正中央,数据科学和机器学习在各行各业开始崭露头角。机器学习开始被应用于解决数据分析问题。机器学习、AI 和预测分析成为 2017 年的热门话题。我们见证了基于数据的价值创新,包括数据科学平台、深度学习和主要几个厂商提供的机器学习云服务,还有机器智能、规范性分析、行为分析和物联网。

2018 年,AI 的发展脚步会加快,这一年将是 AI 技术重生和数据科学得以重新定义的一年。对于雄心勃勃的数据科学家来说,他们如何在与数据科学相关的工作市场中脱颖而出?2018 年会有足够多的数据科学相关工作吗?还是说有可能出现萎缩?接下来,让我们来分析一下数据科学的趋势,并一探如何在未来的大数据和机器学习 /AI 领域获得一份不错的工作。”

增强技术实力

编程语言和开发工具

365 Data Science 收集了来自 LinkedIn 的 1001 数据科学家的信息,发现需求量最大的编程语言为 R 语言、Python 和 SQL。另外,还要求具备 MATLAB、Java、Scala 和 C/C++ 方面的知识。为了能够脱颖而出,需要熟练掌握 Weka 和 NumPy 这类工具。

概率统计学、应用数学和机器学习算法

你需要牢固掌握概率统计学,并学习和掌握一些算法,比如朴素贝叶斯、高斯混合模型、隐马尔可夫模型、混淆矩阵、ROC 曲线、P-Value 等。

不但要理解这些算法,还要知道它们的工作原理。你需要牢固掌握梯度下降、凸优化、拉各朗日方法论、二次规划、偏微分方程、求积法等相关算法。

如果你想找一份高薪的工作,还需要掌握机器学习技术和算法,比如 k-NN、朴素贝叶斯、SVM 和决策森林等。

分布式计算和 Unix 工具

现在大部分机器学习都需要海量数据,所以你无法在单台机器上进行机器学习。所以,你需要用到集群,需要掌握 Apache Hadoop 和一些云服务,如 Rackspace、Amazon EC2、Google Cloud Platform、OpenStack 和 Microsoft Azure 等。

你还需要掌握各种 Unix 工具,如 cat、grep、find、awk、sed、sort、cut、tr 等。因为机器学习基本上都是在 Unix 系统上运行的,所以需要掌握这些工具,知道它们的作用以及如何使用它们。

查询语言和 NoSQL 数据库

传统关系型数据库已经老去。除了 Hadoop 之外,你还需要掌握 SQL、Hive 和 Pig,以及 NoSQL 数据库,如 MongoDB、Casssandra、HBase。

基于 NoSQL 分布式数据库的基础设施已经成为大数据仓库的基础。原先在一个中心关系型数据库上需要 20 个小时才能处理完的任务,在一个大型的 Hadoop 集群上可能只需要 3 分钟时间。当然,你也可以使用 MapReduce、Cloudera、Tarn、PaaS、Chef、Flume 和 ABAP 这些工具。

数据可视化工具

在掌握编程语言和算法的同时,不要忽略了数据可视化的作用。如果无法让你自己或别人理解数据,那么它们就变得毫无意义。数据可视化就是指如何在正确的时间向正确的人展示数据,以便让他们从中获得价值。主要的数据可视化工具包括:Tableau、QlikView、Someka Heat Maps、FusionCharts、Sisense、Plotly、Highcharts、Datawrapper、D3.js、ggplot 等。

正确选择教育背景和专业

要成为数据科学家,不一定非要拿到数据科学方面的学位。事实上,你完全不需要这么做,这样做反而不是个好主意。如果你能拿到计算机学位、工程学学位、经济学学位、数学学位、统计学学位、精算师学位、金融学学位或者自然科学学位(物理、化学或生物)都是可以的。甚至是人文科学(包括社会科学)也是可以的。

但或许你会在其他领域得到更好的发展,比如经济、应用数学或工程领域。首先要确定数据科学这条路是不是适合自己。2018 年绝对不会让那些有志在数据科学领域一展身手的人失望。不过还是那句话,一个具备分析能力的大脑、熟练的编程技能、诚挚的热情和持续自我提升的毅力将决定你的数据科学家之路会走多远。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容