最近很受强化学习的启发,觉得番茄工作法是一个“状态→反馈”的策略循环优化,而学习中很多其他的事情也是这样。 比如,迟交作业的惩罚。 可能因为在国内迟交作业是没有太大关系的。我...
IP属地:重庆
最近很受强化学习的启发,觉得番茄工作法是一个“状态→反馈”的策略循环优化,而学习中很多其他的事情也是这样。 比如,迟交作业的惩罚。 可能因为在国内迟交作业是没有太大关系的。我...
觉得电脑桌面有些凌乱,今天便下定决心整理一番。点开了一直没整理过的“已办与待办”文件夹,三十多个主题文件躺在里面,一如两年之前。 原来那个时候就喜欢把学习计划当做零号文件,两...