focusssss - 简书

发简信

focusssss

5
关注
0
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：北京

focusssss

Deep Reinforcement Learning with Double Q-learning 笔记
1. 前言由于Q-learning将最大值作为动作的价值，因此就难免出现过于乐观的情况，但是有时候乐观有助于更多的探索。作者为了测试overestimation是否会在实际...

Junr_0926
3850 0 1
focusssss

虚拟环境jupyter notebook使用
有两种方式创建虚拟环境，分别是anaconda和virtualenv，本文根据创建虚拟环境的两种方式，分别实现jupyter notebook的应用 1. Anaconda ...

大号扁平脸
10492 1 7

focusssss

臻甄
写了 122029 字，被 134 人关注，获得了 157 个喜欢
focusssss

RL进阶 | TensorFlow熟悉
tensorflow首先要定义神经网络的结构，也就是数据流图, 然后再把数据（张量tensor）放入结构当中去运算和 training。tensor在训练时不断的在节点之间流...

臻甄
1070 0 1
focusssss

迷雾探险12 | RL的开源库
推荐RL开源库参考：https://www.zhihu.com/question/49230922 主流开源强化学习框架推荐如下。提供的强化学习算法较为全面，如Q-lear...

臻甄
2903 0 4
focusssss

fitsir
写了 3390 字，被 21 人关注，获得了 16 个喜欢
focusssss

前向欧拉方程
欧拉方法是一种一阶数值方法，用以对给定初值的常微分方程（即初值问题）求解。它是一种解决数值常微分方程的最基本的一类显型方法。我们用上面的方程来控制位置和速度的变化率。位置...

博士伦2014
7303 0 2

focusssss

博士伦2014
写了 139732 字，被 683 人关注，获得了 844 个喜欢

来自北方，览群书，多游历；曾做过两年基于深度强化学习的机器人控制，现在专注于自然语言处理<br><br>伟大不会放弃你，除非你先放弃追寻她
focusssss

Linux Shell格式化Json
Linux下查看格式化输出json使用json在线解析可以解决问题http://json.cn/ 其实Linux下有现成的工具可以很好的显示 1.直接以文本形式展现输入回...

Andy周
16784 0 2 1
focusssss

你如果也在做强化学习可以互相学习一下😄

【强化学习】gym+baselines+mujoco+mujoco_py安装配置
使用现有的开源框架可以使我们更好地完成强化学习的入门，其中OpenAI给我们提供了gym、baselines、mujoco这些方便学习的环境和算法，要能够很好地使用这些资源，...

我对代码一无所知
17767 2 5
focusssss

谢谢你的文章已经关注你了

【强化学习】gym+baselines+mujoco+mujoco_py安装配置
使用现有的开源框架可以使我们更好地完成强化学习的入门，其中OpenAI给我们提供了gym、baselines、mujoco这些方便学习的环境和算法，要能够很好地使用这些资源，...

我对代码一无所知
17767 2 5
focusssss

我对代码一无所知
写了 4493 字，被 13 人关注，获得了 16 个喜欢

focusssss

【强化学习】gym+baselines+mujoco+mujoco_py安装配置
使用现有的开源框架可以使我们更好地完成强化学习的入门，其中OpenAI给我们提供了gym、baselines、mujoco这些方便学习的环境和算法，要能够很好地使用这些资源，...

我对代码一无所知
17767 2 5
focusssss

Hongtao洪滔
写了 35323 字，被 1209 人关注，获得了 566 个喜欢

博主暂居英国伦敦，从事人工智能和物联网相关工作。<br>欢迎关注我的微信公众号“Tensorflow机器学习”。二维码见下方微信图标。<br>带你掌握智能时代的“算法”，而不是成为这个时代的“数据”。
focusssss

OpenAI gym 强化学习环境库安装以及使用
Abstract 这篇博客大概会记录OpenAI gym的安装以及使用的简要说明。在强化学习里面我们需要让agent运行在一个环境里面，然鹅手动编环境是一件很耗时间的事情,...

DerryChan
7885 0 1

暂无个人介绍