乐乐小宝贝 - 简书

发简信

乐乐小宝贝

25
关注
0
粉丝
3
文章
5006

字数
3

收获喜欢
0

总资产

IP属地：重庆

乐乐小宝贝

Python多进程中的multiprocessing
一、多任务的引入在现实生活中，有很多的场景中的事情是同时进行的，比如开车的时候，手和脚共同来驾驶汽车；再比如，唱歌跳舞也是同时进行的。下来，我们在程序里面，模拟一下“唱歌...

蜀山客e
11583 0 3
乐乐小宝贝

用Python写CLI：参数解析
对CLI程序来说，参数解析大概是一个首要的问题。当然，也有例外。无参数脚本许多常用命令，不需要输入参数，就可以按照我们的预想去执行，比如ls。以Python的Hell...

匿蟒
13434 1 5

乐乐小宝贝

简单理解PPO，可以认为是 PPO = advantage actor critic + TRPO(clip) + GAE + experience replay.其显著特点是可以重复使用小批量经验，实现部分off-policy。写的很好！

深入理解TRPO和PPO算法
最近在整理电脑文件，看到一份当初给同事讲解TRPO算法原理时写的PPT，感觉要比先前那篇写的更加清楚明白，加之这几天刚好在复习RL相关的知识，然后便将PPT的内容加上我比当时...

金色暗影
12977 2 2
乐乐小宝贝

金色暗影
写了 59408 字，被 51 人关注，获得了 105 个喜欢

找一个秋山澪这样的女朋友。
乐乐小宝贝

RL Review part1
1. Basic Word 累计折扣回报：U(t) = r(t) * gamma * r(t+1) + gamma^2 * r(t+2) + ... 动作价值函数：Q(s,a...

2047 0 0
乐乐小宝贝 ·

我觉得存钱才有安全感

希原评论自攒到了人生中第一个十万
乐乐小宝贝 ·

恭喜你

唐小A 评论自攒到了人生中第一个十万

乐乐小宝贝 ·

我和你差不多，我和我爸相依为命

执着的蓝天评论自攒到了人生中第一个十万
乐乐小宝贝 ·

挺羡慕你的，我结了婚以后一直都是负债，还要还房贷

创w 评论自攒到了人生中第一个十万
乐乐小宝贝

攒到了人生中第一个十万
看看我的银行存款，我突然觉得心里一阵欣慰，很想和人分享一下我的喜悦。虽然不多，但是我攒够了我人生中第一个10万。我和妈妈说她什么也没说，她一向就是这样，很不会说鼓励人的话...

扬沙天
12764 81 348 1
乐乐小宝贝

RL-DQN Coding Problem
经验回放类采样一个batch,zip(*)用于将元组解压拆分: DQN的epsilon采用e-greedy方式进行，需要设置epsilon的衰减可以参考判断是否可用GPU ...

3093 0 1
乐乐小宝贝

“ 可以发现当epsilon越大，我们的旧策略参数theta’变动较小”。epsilon: (default = 0.2) 是ppo2论文里面的clip范围，epsilon越大，新旧策略应该是偏离越大，会导致训练的不稳定。正文中刚好说反了吧

Unity ML-agents 参数设置解明
本文首发于：行者AI[https://xingzheai.cn/details/eccfa000888] Unity 是全球最受欢迎的游戏开发引擎之一，有大量的游戏开发者在使...

行者AI
5507 1 0

乐乐小宝贝

DQN算法实践之速通超级马里奥
作为强化学习(Reinforce Learning,RL)的初学者，常常想将RL的理论应用于实际环境，以超级马里奥为例，当看着自己训练的AI逐渐适应环境，得分越来越高，到...

6556 0 2
乐乐小宝贝

网格生成之marching cube算法学习笔记
本博客内容来源于网络以及其他书籍，结合自己学习的心得进行重编辑，因为看了很多文章不便一一标注引用，如图片文字等侵权，请告知删除。传统2D计算机视觉学习笔记目录-------...

开飞机的乔巴
20511 0 18
乐乐小宝贝

颜色信息并不是提前计算好的，无论是高罗德着色（顶点着色）还是phong着色，都是在光栅化像素采样后才计算该像素的具体颜色信息的，望作者注意。

图形学光栅化详解（Rasterization）
计算机的屏幕是二维的平面坐标，以左上角为原点，x轴向右增加，y轴向下增加。在3D图形学中，物体是3维的，拥有X, Y, Z三个坐标，并且拥有R, G, B三种颜色，alph...

白痴毛
63042 10 61 1
乐乐小宝贝

快速理解委托与事件
相信不少初学者对于委托和事件理解的不够深刻。一直有个疑惑：它们的区别在哪？什么时候该使用它们？本篇文章就帮助你快速理解这对双胞胎兄弟。委托是就像类一样，它是一种用户自定义的...

WithStream
4375 0 7
乐乐小宝贝

一个有味道的名字
写了 15690 字，被 13 人关注，获得了 18 个喜欢

乐乐小宝贝

C#——委托与事件系列一
本来应该学习泛型与委托的，但是发现C#这里还没有系统的记录过委托与事件，所以先打算把委托与事件补上再继续泛型与委托的记录。然后呢，今天如果没有意外的话unity方面也会记录一...

一个有味道的名字
5342 1 5
乐乐小宝贝

UI框架重构优化(一)UI加载、消息分发
https://www.jianshu.com/p/666de6c7695a之前这个在原来看来不是太完善所以重构下代码只有在不断地重构(维护)下才会变得越来越好根据最后项目地...

罗卡恩
4196 0 3
乐乐小宝贝

大佬，我正在学习unity做棋牌游戏，可否给demo详细学习一下，谢谢了

unity斗地主洗牌发牌算法实现
如果你要问游戏行业什么游戏开发起来难度小，周期短？是RPG，MMORPG，Moba？亦或是FPS,赛车游戏？其实都不是！棋牌游戏才是开发难度小，周期短的游戏项目。是不是...

Thomas游戏圈
7438 2 3