原文:Free Office Hours for Non-Traditional ML Researchers
作者:Eric Jang
译者:尹肖贻
由同事Colin启发,我萌生了助人的念头,于是写了这篇文章。他在一次推文中写到:“我近来常收到求助的邮件,多来自国外的新人。邮件中说,他们科研态度热忱,无奈因缘弄人,或硕博无门,或良师难觅,或膏火难凑。除学习公开课程,揣摩开放资源之外,还有其他建议吗?”
这些新人的困厄,勾起了我的心酸记忆。虽侥幸成为Google研究人员,我的“非传统背景”(即“没有对口的博士学位”),给我设置了许多障碍。技术岗位通常要求雇员具有博士学位,人工智能 / 机器学习的某些岗位,对资质的要求更为严苛。有些岗位要求,申请者必须是大学教授,或是Google这样大公司的研发科学家,甚至兼而有之。
幸运的是,尽管并不容易成功,Google招聘研究人员时不硬性要求博士学位。申请途径主要有两种[1]:
一是加入“AI Residency Program”(人工智能在地培养计划),该计划是非大学机构(FAANG公司,AI2等)提供的定期工作,旨在启动参与人员的人工智能 / 机器学习的研究生涯。但是,这个计划通常只有一年的时间,参与人员还不足以证明自己“真正成为”为研究人员。(译注:FAANG代表Facebook、Apple、Amazon、Netflix、Google五家科技巨擘公司,AI2代表Allen Institute for AI,艾伦人工智能研究院)
另一种途径是加入偏重机器学习的团队中,从软件工程师(SWE)开始,建立同事对你研究能力的信任。这就是我走的路。我在2016年加入Google,担任Google Brain Robotics团队的软件工程师。虽然按职位说工程师是专职写代码的,但是我平时专注于“最重要的问题”,这个问题就是要思考为什么机器人没有按照最初的设计意图完成命令,我们怎样训练深层神经网络来解决问题。围绕这个主题,我做了一个研究项目又一个研究项目,以致于我现在一直做研究,并发表论文。
在过去的几年中,随着人工智能 / 机器学习领域井喷式的发展,进入研究领域正变得越来越困难(请参阅Colin的推文)。如BAIR这样顶级的博士课程,甚至通常要求学生在申请之前,就要在ICML、ICLR和NeurIPS之类的顶级会议上发表论文。假如我今年刚大学毕业,以我的资质,肯定没有任何博士学位课程愿意录取我,我很可能只捞个定量金融的分析师干干。
对于非传统背景的研究人员来说,本领域更如棘地荆天。他们中具有博士学位的不乏其人。正如科林(Colin)所暗示的那样,由于美国政府的话语主导,国际人士在美国科技公司工作,或在美国学校学习,难度也越来越大。
在机器学习/人工智能领域,劳动力的供求曲线正走向扭曲。一方面,大量来自全球的有志之士涌入,希望解决棘手的工程问题,为科学知识做出贡献,与世界公开分享成果。另一方面,他们似乎缺乏正规的培训或成长的环境,比如:
- 导师的研究指导,学习从术语到行规的内容。更重要的是,学习如何提出好问题,并设计实验来回答这些问题;
- 在公司环境中,领导鼓励软件工程师承担项目的环境,工程师可以大胆主导自己的研究(而不仅为研究人员打打下手)。
免费研讨时间
目前,我没有能力为(2)做什么,但是我绝对可以为(1)提供帮助。为此,我将通过电子邮件和视频会议为来自非传统背景的有志研究人员,提供免费的机器学习研究指导。
我对实用机器学习技术、机器人技术和生成模型最熟悉。就我个人而言,最有资格在这些领域提供建议。除此之外,我有很多相关兴趣,例如量化金融、计算机图形学和神经科学。无论技术主题是什么,我都可以帮你撰写学术论文,降低较为激进的项目失败的风险,或选择研究方向。对于我不熟悉的领域,我将虚心向你求教,开阔视野,学习更多知识。
如果你有兴趣使用此资源,请发送电子邮件至<myfirstname> <mylastname> <2004> <at> <g ****.com>。在你的电子邮件中,包括:
- 你的简历;
- 你想得到什么建议;
- 几句话总结你很酷的研究想法。
有关这些研讨的时间,我还有几句话要说:
- 每周或每两周预定一次Google Meet[2]电话,以检查你的进度并提问。我们将通过Google日历安排15分钟的时段。
- 你在研讨时间的重点,不是要我回答“如何在Google Research找工作”,而是要我扮演类似于导师或助教的角色,来代替博士课程。如果你的研究更深入了,我们可以讨论一下事业上升的路径和机会;但是大多数情况下,我们只进行入门级别的研讨内容。
- 我可能不会替你写代码或做实验。
- 我不想成为幕后大佬之类的角色,在学生的所有论文上印上自己的大名——我提供的大多数建议都是免费的,没有任何附带条件。如果我为你的工作做出了重大贡献,或者与你一起花费了O(10)个小时或以上的时间来取得可发表的结果,我可能要求成为出版物的共同作者。(译注:O(10)是计算机复杂度中大O计数法的戏谑用法)
- 如果我觉得不能为你提供有效的帮助,或者有其他优先事项必须完成,我保留拒绝会议的权利。
- 我不能透露我在Google着手进行但尚未发表的工作,或任何Google的机密信息。
- 我不为企业提供机器学习咨询服务,因此你的研究必须与你目下的工作无关。
- 重申第2点,我不提供职业建议,而是教初学者设计实验、引用和撰写论文,以及有效地发表研究成果。
如果你想问,我这样做是为了什么?我想,首先,可以扩展我的人际网络;其次,我目下的研究工作,人单力薄,不如众人拾柴;第三,我正在尝试扩展学术界的培养体制,这类星火燎原的做法,也许胜于传统的师徒相传。
四年前,我曾梦想有人提供类似的机会,使我得以凿壁借光,一窥科研门径。今天,我想给其他踌躇满志的研究界的新人一个机会,引领大家向着梦想不断向前。
脚注
[1] 克里斯·奥拉(Chris Olah)写过一篇不错的博客,介绍了非传统教育的多重选择和利弊。
[2] Zoom服从中国的内容审查要求 ,所以我较少使用Zoom。