0. 一些啰嗦 2021年了,竟然还有人写关于Faster R-CNN的文章?我的原因主要有两点: 根据我们在实际项目和比赛中的经验,基于RoIAlign和FPN的Faste...
IP属地:吉林
0. 一些啰嗦 2021年了,竟然还有人写关于Faster R-CNN的文章?我的原因主要有两点: 根据我们在实际项目和比赛中的经验,基于RoIAlign和FPN的Faste...
强化学习基础篇(二)马尔科夫决策过程(MDP) 上一篇中主要介绍了强化学习的一些主要组成要素(智能体,环境,奖励,状态以及动作等),以及介绍了强化学习的相关概念。本节主要介绍...
1. 基本概念 比如AlphaGo下围棋,AlphaGo就是强化学习的训练对象,AlphaGo走的每一步不存在对错之分,但是存在“好坏”之分。当前这个棋面下,下的“好”,这是...
Using Keras and Deep Q-Network to Play FlappyBird—— github源码该项目通过卷积神经网络加Q-learning算法,利用...