DAL 今日职位讨论快报 117

#17 2018-10-01

今天分享的职位是一个 Data Scientist 的岗位,来自一个公司 Bigfoot Biomedical。

职位链接:

https://www.linkedin.com/jobs/view/869386360/?eBP=CwEAAAFmMOte3zXz7xs8NYsBkLgJoJ9UI-WNNtXekl29KJU5JKTNQi9PYHtlaVnofD9uDzUs1LcnEuMeiMXvl8HEWscFRd5aQYE5LuaPoRGx8yJLh6PTUUaF4VdMt3FRHkBYRWutFEPWGpU0e5PIMJ9cV2k2S7HLe0eyBnLhq0Wa09Pyr9kUaa0eiD0noilny8EACeWy-0gm0LeRZlc6RTXVVvCJ3XVNVpDzjtsu9428eS_K5oRjNwGGEKZswIjygE-qhPUQknTXtQo9T05vY4OzedCgevW1HWCosZn8opyH4zdTZzBk6fN3inNUgyRJMvnFxBnBBZI--1087aE&refId=4a4bd480-9105-4059-b0e7-07cb08c8e079&trk=d_flagship3_job_home&lipi=urn%3Ali%3Apage%3Ad_flagship3_job_home%3Bn0LppgrySHGHMZG3YwylDQ%3D%3D&licu=urn%3Ali%3Acontrol%3Ad_flagship3_job_home-similartoviewed_view_job

背景介绍:

首先我们来看它是属于哪个领域,我们应该可以判定它是属于 healthcare technology 的领域。我们主要对于healthcare 能做什么?除了能去通过数据分析能帮助用户带来更好的服务,更适合他们的服务以外。我们还要在marketing上做一些事情,我们应该要通过数据分析去避免用户或者说患者的流失,这里就需要你去建模去看看到底是怎么样的模型能去 fit 这个公司所需要的东西。

关于 Churning modeling 的两个数据分析的技术:1. classification,对你的用户来进行分组和分类。你通过去看他的 turning rate 和 survival rate 去看这个具体用户。从不同的角度去看留下来的,和流失走的用户都各自有什么特点,然后我们怎么在此基础上去分析。2. prediction modeling,基于你的数据样本去推算一些东西。比如你的以往的退订的 timing 或者特别的 user behavior 来去预测用户的行为,并且可以给你们的用户一些适时适当的激励来减少他们的退订。

职位介绍:

Quickly bring clarity to business/clinical/product design/engineering challenges.

Work with stakeholders to plan approach, define success.

👆废话

Use tools such as Matlab to turn data into knowledge which can be used to drive decisions.

如果这个 JD 在反复提到 Matlab 这个事情,希望大家千万不要漏掉这个 skill

Must haves we’re looking for:

5+ years of data science experience.

其实呢,数据科学革命的大潮是从 2014 年开始的,所以就算我们掰指头算,也就五年,所以不要太被这个限制了。

Expert knowledge of analytical techniques:  distribution fitting, multivariate statistics, stochastic modeling, time-series modeling, design of experiments, Monte Carlo methods, robust statistics, sampling, segmentation, clustering, hypothesis testing, regression, forecasting.

这里说的非常非常详细,敲黑板,必须要在你的简历里提到。这里除了需要你明白一些模型,还需要你有design一些test的能力,一定一定都要提前做功课。

Analytical language and framework familiarity:  experience with and ability to assimilate tools like Python, Matlab, R, Hadoop, SAS, JMP, Tableau, d3js.

这里能看出来对于编程能力要求还是挺多的,但我们还是主要put focus on Python R Matlab。

T-shaped:  strong in data science, but also strong capabilities to deliver actionable results in a collaborative startup environment.

这里要求你能够去 deliver 一个可以执行的结果和方案,主要是考量你的执行力。

Excellent pragmatic problem solving, data-driven problem solving approach, extreme attention to detail, strong written and verbal communication skills, curiosity, and a demonstrated ability to learn and grow new skills and experiences.

这一条是偏 behavioral 的东西。

We’d prefer if you also have: 【加分项】

Data visualization skills:  quickly and effectively “tell the data story;” draw from a large portfolio of visualization techniques to bring salient points forward to stakeholders for whom statistics may not be a core competency.

数据可视化对于要面向客户的业务是非常重要的。

Domain expertise: knowledge of diabetes, knowledge of control engineering: feedback control, discrete and continuous time transfer functions, system identification, PID, model predictive control.

这个对于我们大部分的人来说是一个比较难的要求了,很多人都是没有的。那我的建议就是你可以通过一个“偷换概念”或者说通过一个别的东西去体现你有这方面的能力就好了。

Lean/agile experience:  scrum teams, daily standups, time-boxed development, visual management systems, peer collaboration.

这是一个开发的模型,大家可以去了解一下,不需要太多深挖和研究。

Data munging / data wrangling proficiency: demonstrated ability to collect, extract, transform, clean, and combine structured and unstructured data from myriad sources.

这个是很基本的数据分析师,数据科学家都必须有的技能。大家一定要熟悉这个 full cycle。

Educational Requirements:

Master’s degree in a field related to data science: mathematics, statistics, computer science, engineering, physics, machine learning, data mining, actuarial science, econometrics

这是一个比较硬的东西,master degree 肯定是要的,专业其实没有特别多的限制。

Q & A

Q:关于 Chrun Prediction,多说两句?

A:三个步骤 --> 收集数据,在历史数据上去 run model,你要去 load 一个形式为概率的结果。在数据采集数据整理的过程中,你要去做一个 data modeling,feature engineering 啊等等去给用户画像的内容。除了这些静态数据,你还可以分析一些动态的数据,比如他是否没有按时交费?使用健康仪器的 frequency?很多的这些动态数据都会变成你很重要的 indicator。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容

  • 今天早上没训练老师教我们强求动作,然后我们就跑了10圈就回教室了等到下午他们一个是我们再去看老师生病了他回去了所以...
    寂寞的时光者阅读 93评论 0 0
  • NP电子科技公司 北京NP电子科技公司成立于2010年3月3日,是一家专注于智能硬件和电子产品研发的移动互联网公司...
    浮生不若梦_f79f阅读 583评论 0 0