常见的算法原理
1、对产品经理的意义
不必深入研究每一种算法,但应该了解一些在人工智能方面常见的基本算法和基本原理。一方面能够理解算法在应用时需要什么样的数据,另一方面可以知道如何建立流程,有利于在建模过程中配合AI工程师进行项目把控。同时,AI产品经理通过了解常见的算法,需要让自己明白人工智能的“能与不能”,从而对一个新的产品做好初步评估工作。
2、人工神经网络
人工神经网络:ANN Artificial NeuralNetwork是一种模型和一类算法的统称,旨在帮助计算机学习。是计算机实现人工智能的重要工具和手段
基本结构
单元和神经元
是神经网络的最小单元
权重
神经网络训练的过程就是在寻找最佳的权重值
偏置项
与权重类似
超参数
手动设置的
激活函数
也被称为映射函数
隐含层的概念
特点和优越性
具有自学习功能
自学习功能对于预测有特别重要的意义
具有联想存储功能
具有告诉寻找优化解的能力
3、深度学习
深度学习神经网络是人工神经网络中的一种算法。
深度学习的训练过程,在训练过程中有“预训练”,之后再使用微调技术对整个网络进行优化训练。这两种技术的运用大幅算短了训练多层神经网络的时间。
深度学习中的三个经典神经网络
深度神经网络DNN
卷积神经网络CNN
循环神经网络RNN
4、支持向量机
支持向量机 SVM Support Vector Machine,是一种监督式的学习方法,可广泛应用于统计分类以及回归分析中。支持向量机曾是深度学习发展最受欢迎的学习算法之一,2012年后逐渐式微。相比较于深度学习神经网络,支持向量机的优势是消耗的计算资源更少。支持向量机并不是神经网络,是两种完全不一样的方法
5、主成分分析
主要成分分析 PCA Principal Component Analysis,主要成分分析是最简单的以特征量进行分析的多元统计分布的方法,主要是利用降维的思想,将多指标转化为少数几个综合指标。
PCA主要运用数据降维,降维致力于解决3类问题
通过降维环节数据维度灾难问题
通过降维,可以再压缩数据的同时让信息损失最小化
通过降维,将难以理解的几百个维度的数据结构转变为更容易理解的两三个维度
6、K-means算法
根据不同的模式有不同的聚类算法,K-means算法是一个经典的基于原型的目标函数的距离聚类方法的代表,是一个对相似的数据进行聚类的迭代算法
7、关键词
关键词是指能够反应文本语料主题的词语或短语。
关键词提取技术可用于自然语言处理。一类依赖外部知识库,另一类不依赖外部知识库
8、集成学习方法
集成学习方法 Ensemble learning 指的是通过组合学习算法的方式提高机器学习效果的一种发发,与单一模型相比,集成学习通过集合多种模型,更容易提供更好的结果。
集成策略:平均法、投票法、学习法