#17 2018-10-01
今天分享的职位是一个 Data Scientist 的岗位,来自一个公司 Bigfoot Biomedical。
职位链接:
https://www.linkedin.com/jobs/view/869386360/?eBP=CwEAAAFmMOte3zXz7xs8NYsBkLgJoJ9UI-WNNtXekl29KJU5JKTNQi9PYHtlaVnofD9uDzUs1LcnEuMeiMXvl8HEWscFRd5aQYE5LuaPoRGx8yJLh6PTUUaF4VdMt3FRHkBYRWutFEPWGpU0e5PIMJ9cV2k2S7HLe0eyBnLhq0Wa09Pyr9kUaa0eiD0noilny8EACeWy-0gm0LeRZlc6RTXVVvCJ3XVNVpDzjtsu9428eS_K5oRjNwGGEKZswIjygE-qhPUQknTXtQo9T05vY4OzedCgevW1HWCosZn8opyH4zdTZzBk6fN3inNUgyRJMvnFxBnBBZI--1087aE&refId=4a4bd480-9105-4059-b0e7-07cb08c8e079&trk=d_flagship3_job_home&lipi=urn%3Ali%3Apage%3Ad_flagship3_job_home%3Bn0LppgrySHGHMZG3YwylDQ%3D%3D&licu=urn%3Ali%3Acontrol%3Ad_flagship3_job_home-similartoviewed_view_job
背景介绍:
首先我们来看它是属于哪个领域,我们应该可以判定它是属于 healthcare technology 的领域。我们主要对于healthcare 能做什么?除了能去通过数据分析能帮助用户带来更好的服务,更适合他们的服务以外。我们还要在marketing上做一些事情,我们应该要通过数据分析去避免用户或者说患者的流失,这里就需要你去建模去看看到底是怎么样的模型能去 fit 这个公司所需要的东西。
关于 Churning modeling 的两个数据分析的技术:1. classification,对你的用户来进行分组和分类。你通过去看他的 turning rate 和 survival rate 去看这个具体用户。从不同的角度去看留下来的,和流失走的用户都各自有什么特点,然后我们怎么在此基础上去分析。2. prediction modeling,基于你的数据样本去推算一些东西。比如你的以往的退订的 timing 或者特别的 user behavior 来去预测用户的行为,并且可以给你们的用户一些适时适当的激励来减少他们的退订。
职位介绍:
Quickly bring clarity to business/clinical/product design/engineering challenges.
Work with stakeholders to plan approach, define success.
👆废话
Use tools such as Matlab to turn data into knowledge which can be used to drive decisions.
如果这个 JD 在反复提到 Matlab 这个事情,希望大家千万不要漏掉这个 skill
Must haves we’re looking for:
5+ years of data science experience.
其实呢,数据科学革命的大潮是从 2014 年开始的,所以就算我们掰指头算,也就五年,所以不要太被这个限制了。
Expert knowledge of analytical techniques: distribution fitting, multivariate statistics, stochastic modeling, time-series modeling, design of experiments, Monte Carlo methods, robust statistics, sampling, segmentation, clustering, hypothesis testing, regression, forecasting.
这里说的非常非常详细,敲黑板,必须要在你的简历里提到。这里除了需要你明白一些模型,还需要你有design一些test的能力,一定一定都要提前做功课。
Analytical language and framework familiarity: experience with and ability to assimilate tools like Python, Matlab, R, Hadoop, SAS, JMP, Tableau, d3js.
这里能看出来对于编程能力要求还是挺多的,但我们还是主要put focus on Python R Matlab。
T-shaped: strong in data science, but also strong capabilities to deliver actionable results in a collaborative startup environment.
这里要求你能够去 deliver 一个可以执行的结果和方案,主要是考量你的执行力。
Excellent pragmatic problem solving, data-driven problem solving approach, extreme attention to detail, strong written and verbal communication skills, curiosity, and a demonstrated ability to learn and grow new skills and experiences.
这一条是偏 behavioral 的东西。
We’d prefer if you also have: 【加分项】
Data visualization skills: quickly and effectively “tell the data story;” draw from a large portfolio of visualization techniques to bring salient points forward to stakeholders for whom statistics may not be a core competency.
数据可视化对于要面向客户的业务是非常重要的。
Domain expertise: knowledge of diabetes, knowledge of control engineering: feedback control, discrete and continuous time transfer functions, system identification, PID, model predictive control.
这个对于我们大部分的人来说是一个比较难的要求了,很多人都是没有的。那我的建议就是你可以通过一个“偷换概念”或者说通过一个别的东西去体现你有这方面的能力就好了。
Lean/agile experience: scrum teams, daily standups, time-boxed development, visual management systems, peer collaboration.
这是一个开发的模型,大家可以去了解一下,不需要太多深挖和研究。
Data munging / data wrangling proficiency: demonstrated ability to collect, extract, transform, clean, and combine structured and unstructured data from myriad sources.
这个是很基本的数据分析师,数据科学家都必须有的技能。大家一定要熟悉这个 full cycle。
Educational Requirements:
Master’s degree in a field related to data science: mathematics, statistics, computer science, engineering, physics, machine learning, data mining, actuarial science, econometrics
这是一个比较硬的东西,master degree 肯定是要的,专业其实没有特别多的限制。
Q & A
Q:关于 Chrun Prediction,多说两句?
A:三个步骤 --> 收集数据,在历史数据上去 run model,你要去 load 一个形式为概率的结果。在数据采集数据整理的过程中,你要去做一个 data modeling,feature engineering 啊等等去给用户画像的内容。除了这些静态数据,你还可以分析一些动态的数据,比如他是否没有按时交费?使用健康仪器的 frequency?很多的这些动态数据都会变成你很重要的 indicator。