强化学习(1)概述

MachineLearninginMarketing

强化学习通过自己进行学习,属于无监督学习,计算机在过程中不断尝试和摸索来尝试学习。这里有一位评审员对你的行为进行打分。我们正确行为会的得到高分,可以暂时这么理解,所有强化学习具有分数导向性。

在监督学习中已经有了数据和数据对应标签,强化学习需要一次一次地尝试获取数据和其对应的标签。
强化学习中包含许多算法

基于价值选行为的算法

  • Q learning (基于表格)
  • Sarsa
  • Deep Q Network (基于神经网络)

基于选行为

Policy Gradients

想象环境

Model based RL

为什么学习强化学习

一切都是因深度学习,强化学习也是因为深度学习出现才有质的飞跃。强化学习是数据小或者我们也没有经验的事物上采用强化学习可以得到好的结果。

需要了解哪些 python 库

  • Numpy 数据处理
  • Pandas 数据处理
  • Matplotlib 数据开可视化
  • Tkinter 编写模拟环境
  • Tensorflow
  • OpenAI gym 提供了很多现成的模拟环境
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 项目地址,本篇是算法篇,另可参阅实习感受。 本项目主要是将深度强化学习(RL)中的MADDPG——混合竞争合作环境...
    Nino_Lau阅读 9,011评论 0 0
  • 一. 增强学习简介 1.1 什么是增强学习? 机器学习的算法可以分为三类:监督学习,非监督学习和增强学习。 增强学...
    阿阿阿阿毛阅读 31,464评论 0 25
  • 1.强化学习资源 函数库 1、RL-Glue:提供了一个能将强化学习代理、环境和实验程序连接起来的标准界面,且可进...
    机器学习小济公阅读 6,046评论 0 8
  • 目前搜到的资料汇总 视频教程 李宏毅机器学习课程第28讲 ,深度强化学习入门课程相关PPT链接 密码:77u5李飞...
    臻甄阅读 4,071评论 0 1
  • 今天是父亲节,全天下已为人父的男生的节日,我亲爱的老爸的节日。 很多人借着今天这个特殊的日子说着平常觉得煽情的话。...
    文惜姑娘阅读 3,868评论 11 10