分类与预测

1,常用的分类与预测算法

     回归分析(连续)

        线性回归                             一般用作预测

        非线性回归

        Logistic回归 (因变量为0,1)     一般用作分类

        岭回归

        主成分回归

        偏最小二乘回归

    决策树(离散)

    人工神经网络

    贝叶斯网络

    支持向量机(离散)

2, 算法详解

         2.1 回归分析    

                Logistic 回归 (概率型非线性回归)

                ☉ 特征筛选 (可以用scikit-learn feature_selection)

                ☉ 估计模型回归系数

                ☉  模型检验    

                ☉  模型应用


         2.2 决策树

                    ID3算法, C4.5算法, CART算法,SLIQ算法,SPRINT算法,PUBLIC算法

                ☉  ID3算法  通过信息增益作为属性的选择标准 ,一般处理离散型的描述属性

                    GainA(A信息增益)= Info (总的信息熵) - InfoA (A信息熵)  A为某属性

                ☉  C4.5算法 通过信息增益率作为属性的选择标准,可以处理离散及连续的描述属性

                ☉  CART算法是一种非参数分类和回归方法


         2.3 人工神经网络 

                        激活函数:域值函数,分阶段函数,非线性函数,Relu函数

                ☉  BP神经网络(求解算法用新型的逐层训练算法,就是深度学习)

                ☉  LM神经网络

                ☉  RBF径向基神经网络

                ☉  FNN模糊神经网络

                ☉  GMDH神经网络

                ☉  ANFIS神经网络

                ☉  。。。

                python 中的Keras算法库适用于人工神经网络模型。

                人工神经网络的拟合能力强,为了防止过拟合,流行做法是让部分神经网络节点休眠。

3,分类与预测算法评估

        绝对误差与相对误差

        平均绝对误差

        均方误差

        均方根误差

        平均绝对百分误差

        Kappa统计

        误差准确度

        识别准确度

        反馈率

        ROC曲线

        混淆矩阵

4,分类预测模型特点


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 前些天在做一个银行卡的校验,在网上搜了好久也没有找到能用的正则表达式,就自己写了了根据银行卡的bin值判断该卡所对...
    Orz013阅读 8,298评论 6 10
  • 谁说是黑夜给了我黑色眼睛 否则我不会偏爱那一隅黎明 在阳光明媚的日子里 希望依旧是最微弱的气息 终于抓住了松鼠的尾...
    锦玥阅读 1,630评论 0 0
  • 大概是深夜 脑海里是寂静的吵闹 隔壁是粘稠的呼吸 我伸手触碰陌生的墙壁 尽力张开胡思乱想的眼睛 猜测到 清晨的车马...
    cookie猫阅读 3,821评论 0 2

友情链接更多精彩内容