data scientist是个啥--配合datacamp上的课(没有一个编程题)

屏幕快照 2019-06-30 01.12.08.png

比起直接问顾客对你的新产品感兴趣吗。应该问 和老产品比起来怎么样,或者问 和竞争对手的同质产品比起来,新产品怎么样。

tabular - relational

屏幕快照 2019-06-30 11.42.45.png

这三个再加一个stacked bar chart

用什么做一个dashboard?


be consistent across an organization

cluster就是server

data analytics + machine learning + deep learning 是三个东西

data science workflow: data collection comes first, --> exploration and visualization, then experimentation and prediction(包括分类和预测,a linear regression to estimate也是的。

OKR stands for Objective/Key Result 目标和结果

Add Transparency to Company KPIs:
不是说增加透明度,要理解为增加信息的一目了然。可以做newsletter和dashboard

Persona和Profile
可以有好几个persona/ profile(用户角色、用户画像),卖汽车的比如主妇的需求可以和白领类似,那么他们算一个persona
1 .用户角色不是用户细分
我们关注的是用户如何看待、使用产品,如何与产品互动,这是一个相对连续的过程,人口属性特征并不是影响用户行为的主要因素。根据使用、需求来聚类划分。
可以探索的方向有:动机、能力(被阻碍的点)、环境、来自他人的影响、persona之间的关系(四象限图, 又称矩阵图)
2.用户角色不是平均用户
3.用户角色不是真实用户**

regular job: A/B test, dashboard
偷时间的job: ad-hoc requests (一次性的,某个时间节点的,不用更新的)

A/B test

The less sensitive our tests,(Minimum Detectable Effect越小) the smaller the sample size we need.
the baseline conversion increases(和原来比,提升效果更明显), it becomes easier to reach significance

(ml就是用来做预测的) machine learning is a set of method for making predictions on existing data (with labels and features)

有监督的学习就是有labels & features:
case study: subscribe or churn(订了又退订)(结果就是labels)

  1. training data
  2. find features (影响因素)
  3. 得到一个model 先用test data测试
  4. 然后做prediction。 如果这个人不会churn,那可以把它计入下个月的revenue;如果他要churn,就reach out and offer a special promotion

无监督的学习:例子clustering (聚类)
无监督学习use data only with features 比如customer category

  1. select features define # of clusters
  2. use clusters to solve business problems (在联系前面有监督的学习,对不同的clusters可以分别做预测~)

Special topics in ML

  1. time series forecasting (把时间看做一个feature,有监督的学习)
    商业问题像 seasonality 就是时间序列预测的一个应用
    Topic 2: NLP 自然语言处理 (根据具体问题,从text提取信息,去创造features)

data-intensive的事情machine learning做不了,要用deep learning做(涉及到神经元)。一般应用于{{ language learning(比如从会议纪要中自动总结概要) 和 image classification }}
Anything involving a physical device is probably an IoT problem 物联网

Deep Learning and Explainable AI:
Deep Learning 又叫做 神经网络,

  1. It requires much much more data than traditional ML.

  2. Best used in less structured input 比如文本和图像

  3. can give high accurate predictions (predictive)。但人们不知道,为什么做出这个假设来。(DL 缺乏解释力度,用来讲清楚what)
    网路说的 Deep learning能做一切数据挖掘有关的事情

    Explainable AI 可以讲清楚影响因素,讲清楚why leads to such results。传统ML 也可以解释为啥。AI 让计算机自己动手,ML 训练计算机动手。
    又有人说 DL is part of ML is part of AI

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前言 《四柱特训班讲义》一书,是笔者根据2003年春举办的四柱特训班讲课记录的基础上整理出来的。它是以《四柱详真》...
    小狐狸娃娃阅读 12,070评论 1 29
  • 禅意自在阅读 75评论 0 0
  • 生活不止有篮球与妥协,还有诗和远方的田野。 这句话用在拉里·桑德斯的身上在确切不过了。 拉里-桑德斯在两年前选择离...
    篮球行为大赏阅读 545评论 4 8
  • 近日,著名主持人吴昕受邀出席了巴黎时装周,并携手法国时尚品牌ETAM拍摄街拍大片,在巴黎街头演绎最新秋冬时髦单品。...
    精品lifestyle阅读 215评论 0 0
  • 今天是2016年的最后一天除夕之夜,这一天除了铺天盖地的微信好友发来的祝福信息,还有准备年夜饭的忙碌,今年同往年不...
    熊雪莹阅读 370评论 0 1