我们将探讨产品目标、产品实战过程、算法模型实战以及产品经理的难易程度之间的区别。通过多个案例,比较AI产品经理和数据产品经理之间的联系与区别,并深入了解两者的技能。
人工智能快速渗入各行业,AI产品经理需求量大,成为稀缺人才。"AI产品经理"项目面向希望利用AI技术推动业务发展的产品经理和商业领导者。
将介绍如何制作有商业价值的AI产品,学习AI产品开发流程。您将学习案例研究、创建数据集,并构建AI模型,熟练掌握各种AI概念和实用技能,能够构思、开发、评估和实施基于人工智能技术的新产品。
而数据产品经理也是时下的热门岗位。
两者关系是,AI产品经理以数据为基础,数据产品经理发展的晋级阶段是AI产品经理。
先了解一下:AI产品经理
岗位职责:
了解行业和用户需求,收集和挖掘需求,分析需求,制定产品战略规划,设计产品解决方案,分析最佳的AI解决方案(例如,使用何种AI技术、哪种模型),与AI训练师和AI工程师沟通,完成产品演示,推动产品上线,跟踪数据,并提出产品优化方案。
岗位需求背景:
无论在哪个领域,做产品都需要产品经理。只不过在AI领域,需要对AI行业知识理解深刻的产品经理,这样的产品经理具备边界判断的能力以及判断最佳解决方案的能力,我们把这样的产品经理叫AI产品经理。
具体工作内容:
1)调研行业,理解行业业务,收集或挖掘行业需求
2)深刻理解需求,分析目标用户,输出用户画像
3)定位产品,制定产品战略(结合对市场发展趋势、竞品等的理解)
4)找出解决需求的方案,并转化为AI产品;选择最佳AI解决方案(带着需求和产品规划与AI工程师、AI训练师深度沟通),并判断落地可行性及可实现程度;参与制定数据标注规则。
5)设计产品,输出产品demo及各种文档(流程图、PRD等)
6)向AI训练师收集产品优化建议
7)优化产品
8)评估产品,计划开发(UI设计及开发)阶段、周期。制定验收标准
9)验收产品,与运营对接,上线
能力模型:
1)AI技术理解力——跟AI工程师交流时能厘清AI概念,判断技术边界(能不能做,能做到什么程度);能结合产品体验,做好交互设计,使得AI部分的表现形式最佳;了解需要什么样的数据,甚至设计最佳数据采集功能,使应用可以更好的采集高质量数据,累积以备利用。
2)AI行业理解力(兼具创造力)——具备AI行业知识框架,能够结合系统化的AI知识展开逻辑性思维,探讨AI带来的新行业可能性。
3)传统互联网产品经理的通用能力
AI产品与数据产品的差别
第一点区别:产品目标不同
有时候产品经理必须坚定地提出需求,经常会遇到各方的质疑,这个需求可靠吗?有时候产品上线后大家可能感到高兴,但公司却未带来良好的商业增长;
当增长遇到瓶颈;当产品无法精准推荐给用户;当生产效率降低;当产品经理无法预测新的产品需求和服务需求;当人力成本上升,有些固定流程工作可以由机器人代替;
前类主要是数据产品经理要解决的问题,通过数据来验证产品提出的产品需求的正确性,通过上线后的数据来发现产品需要迭代改进甚至创新的点,通过数据分析,数据挖掘发现原本发现不了的产品问题,改进问题。
后类主要是AI产品经理的产品目标,AI一方面能帮人节省时间,另外能预测原本发现不了的产品和服务需求,还有AI能够解决不确定性的产品服务需求。
数据产品经理的目标是通过数据确认确定性的需求;AI产品经理的目标是创造性地解决不确定性的产品需求。
第二点区别:产品实战过程不同
先讲数据产品经理的产品过程,再看AI产品经理的产品过程。
数据产品经理的数据分析的步骤一般可以分为如下6个步骤:
明确分析的目的数据准备数据清洗数据分析数据可视化分析报告数据产品经理案例:朝阳医院医药销售情况数据分析经典案例拆解
1. 分析目的
通过对朝阳区医院的药品销售数据的分析,了解朝阳医院的患者的月均消费次数,月均消费金额、客单价以及消费趋势、需求量前几位的药品等。
2. 数据导入
从本地读取数据,如果需要数据分析进一步的可以点击文章最后的链接。
3. 数据清洗
数据清洗包含,行缺失值、列缺失值、异常值如不该出现负值出现了负值,不该过大不该过小等异常值的清洗、数据列名的修改变更、数据类型的转换、数据重新抽取排序等等清洗。
4. 数据分析
数据产品经理的数据分析主要是数据对应的业务分析,数据场景分析,常由数据产经理提出产品分析方案,例如本案例中,月均消费次数的业务定义计算方式是:月均消费次数 = 总消费次数 / 月份数;
月均消费金额的业务定义计算方式是:月均消费金额 = 总消费金额 / 月份数;客单价业务定义计算方式是:客单价 = 总消费金额 / 总消费次数。等等
5. 数据可视化
对于擅长形象思维的同学来说,文不如图,图不如视频,数据可视化就是讲数据分析的文变成形象的图或者变成可视化直观化的结构呈现的更直接明了。
例如本案例中药品销售前十的情况如下图:
6. 产品数据分析报告
产品数据分析报告无固定的形式,根据笔者的经验有的专家直接带着一张嘴也行,有的写成PPT,有的用Word文档,有的则是PDF,有的是个其他的文档或者图片。
第三个区别、AI产品经理需要参与推动的重要流程
1)分析用户需求,找到痛点并思考用什么样的AI方案进行解决
2)设计产品的后台数据采集功能,保证数据的采集更方便机器学习时利用(设计产品时,要分析出机器学习时需要的数据量、数据类型以及数据特征)
3)与AI训练师沟通制定数据标注规则
4)与AI工程师进行交流,告知AI工程师需要的AI模型,预期效果,以及与客户端的数据交互需求。与用户端工程师进行交流,告知AI如何与客户端进行数据交互
5)设计客户端,推动客户端开发实现
6)数据训练机器
准备样本数据(训练数据和测试数据)--为训练数据打标签--输入带标签的训练数据--输入测试数据--查看拟合度,或调整模型参数--循环训练直至达到最佳拟合。
7)检查训练后的AI模型是否满足需求。若不满足,与AI工程师共同分析问题并找出解决方案
8)将成型的AI产品面对“用户角色”测试,无问题后上线正式运营
AI产品经理案例:
AI产品内容领域增长方向更加明显,根据实际工作发现有以下几个产品实战过程方案。
神经网络、机器学习和深度学习软件产品;机器人、芯片、智能硬件和软硬件协同产品;具有行业经验,以场景驱动AI赋能;以AI算法创新为主。本文首先介绍了以神经网络、机器学习和深度学习软件为主的产品方案解决过程。
AI产品经理案例:训练神经网络经典案例拆解
选定一个基础模型设定初始化参数代入模型用训练集对模型进行训练通过一些数量指标,评估训练误差如果训练误差不满足要求,继续调整参数重复7–8次采集新的数据,生成新的数据集。
(1)选定一个基础模型
本篇选择sklearn.neural作为基础训练模型框架。如下图
(2)设定初始化参数代入模型
设置神经网络模型参数,隐藏层坐标大小(50,50)。
(3)训练出模型,用训练集对模型进行训练
导入数据,一次训练模型,采用训练集数据训练MLP分类器模型
一次查看模型训练结果,将一次训练的模型保存
(4)通过一些数量指标,评估训练误差
通过准确率数据、通过绘制误差曲线等等评估模型训练效率。
(5)如果训练误差不满足要求,继续调整参数
重新优化节点数等参数,再次训练模型
(6)重复7–8
重新调整,坐标、节点、训练次数等参数、超参数,重复训练模型,最终选择优秀的模型备用。
(7)选择新的数据,生成新的数据集
本篇使用的是著名的MINST数据集,如果需要请关注笔者的微信公众号LineLian数智产品窗口。
针对这个图像数据集存在的问题比较明显,1.训练的数据数量;2.数据标注的质量;鉴于此,可以使用自己的自有Label数据集重新训练新的模型。
第三点区别:算法模型不同
数据产品经理常用的算法如下:
对于数据分析所采用的的算法非常多,主要是解决验证性和确定性问题的算法,例如:回归、三次多项式等等算法均可以属于数据产品经理采用的数据分析算法。
1. RFM算法模型
RFM模型想必很多搞数据做产品运营的同学都听说过,最常用在用户分层管理中。而且很多提到RFM模型都会动不动就祭出。
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。
2. CART: 分类与回归树
CART, Classification and Regression Trees。
在分类树下面有两个关键的思想:第一个 是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。
3. K-Means算法
k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割(k < n)。
它与处理混合正态分布的最大期望算法(本十大算法第五条)很相似,因为他们都试图找到数据中自然聚类的中心。
它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。
4. 关联规则Apriori算法
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
5. SVM支持向量机
支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。
它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。一个极好的指南是C.J.C Burges的《模式识别支持向量机指南》。van der Walt 和 Barnard 将支持向量机和其他分类器进行了比较。
6. 最大期望(EM)算法
在统计计算中,最大期望 (EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉数据集聚(Data Clustering)领域。
7. PageRank算法
PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。PageRank根据网站的外部链接和内部链接的数量和质量,衡量网站的价值。
PageRank的概念是,每个链接到页面的链接都是对该页面的一次投票,被链接得越多,就意味着被其他网站投票越多。这就是所谓的“链接流行度”——衡量有多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念源自学术论文中被引述的频度——即被引述次数越多,一般判断该论文的权威性就越高。
8. AdaBoost 迭代算法
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。
9. 其他数据分析算法模型
AI产品经理常用的算法如下:
(1)神经网络算法模型
起步神经网络算法( Neural Network )是机器学习中非常非常重要的算法。这是整个深度学习的核心算法,深度学习就是根据神经网络算法进行的一个应用特例。某种程度上来说AI产品的入门在于对神经网络算法的理解和应用。
(2)机器学习算法模型 Maching learning
机器学习的对象是:具有一定的统计规律的数据。
机器学习根据任务类型,可以划分为:
监督学习任务:从已标记的训练数据来训练模型。主要分为:分类任务、回归任务、序列标注任务。无监督学习任务:从未标记的训练数据来训练模型。主要分为:聚类任务、降维任务。半监督学习任务:用大量的未标记训练数据和少量的已标记数据来训练模型。强化学习任务:从系统与环境的大量交互知识中训练模型。机器学习根据算法类型,可以划分为:
传统统计数据学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。
(3)深度学习DeepLearning
深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。
这一类算法基于神经网络,可解释性较差,强烈依赖于数据集规模。但是这类算法在语音、视觉、自然语言等领域非常成功。
没有免费的午餐定理(No Free Lunch Theorem:NFL):对于一个学习算法A,如果在某些问题上它比算法B好,那么必然存在另一些问题,在那些问题中B比A更好。
(4)CNN
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
(5)RNN
循环神经网络(Recurrent neural network:RNN)是神经网络的一种。单纯的RNN因为无法处理随着递归,权重指数级爆炸或梯度消失问题,难以捕捉长期时间关联;而结合不同的LSTM可以很好解决这个问题。
时间循环神经网络可以描述动态时间行为,因为和前馈神经网络(feedforward neural network)接受较特定结构的输入不同,RNN将状态在自身网络中循环传递,因此可以接受更广泛的时间序列结构输入。手写识别是最早成功利用RNN的研究结果。
(6)GNN
图神经网络,图神经网络划分为五大类别,分别是:图卷积网络(Graph Convolution Networks,GCN)、 图注意力网络(Graph Attention Networks)、图自编码器( Graph Autoencoders)、图生成网络( Graph Generative Networks) 和图时空网络(Graph Spatial-temporal Networks)。
(7)其他神经网络。
第四点区别:产品经理驾驭难度不同
产品经理驾驭产品的难易程度参考下图:
第五点联系:最后AI产品经理与数据产品经理既有区别也有联系
联系是:数据产品经理常用的元素数据是AI产品经理常用的元素数据+算法+算力三元素之一。
做好数据产品经理是为了今天的饭碗,做好AI产品经理是为了明天的希望。两者都很重要。
总之AI产品经理和数据产品经理是唇齿相依的关系!