我们想要的是通过之前的平均值,求新的平均值:只要知道了的算法,就可以实现只要已有平均值 和 新添加值,就可以算出新的平均值 用 和 带入公式...
数据和枚举的对应关系:{A:1, B:2, C:3, ...} 网络层输入按照枚举方式,比如是A的话,那么输入层就是A: [1, 0, 0, 0...
是无知的可怕。 有一类数,可以用两个数的比值来表示,比如 在古希腊(及希腊系的英语),这类数叫 ratio(估算,计算,原因,两数的关系,和re...
probability:发生的概率 发生的次数/总次数0:不发生 1:必发生 odds:发生比 发生的概率 / 不发生的概率0:不发生,:必发生...
从一个样本空间中,抽样。比如:我要抽 [0, 1, 2] 三个物体,共100次,那我希望: 0能抽到20次左右 1能抽到70次左右 2能抽到30次左右
policy gradient 其实就是 的平均数: corssentropy是加法,总和。这里需要每一项,所以就取一个平均值。 好算,就是递...
国内游戏公司普遍分不清 项目经理 和 制作人,产品经理的区别。我试着区分一下: 国外 制作人 这个职位,不负责 游戏的设计 和 发布(对这两样的...
Q-learning 是RL的核心 Q 代表 Quality 品质 系统维护一个Q值表: 13.31.622.67.832.49.541.35....
数组维度和方向(连接) gather() 函数是按照索引选取数字: 一个二维数组,如果沿第0维选取元素,则按照将头方向依次选取数字。0,2,1就...